docarray/tests/unit/array/test_base_getsetdel.py at docarray-v1-fix · docarray/docarray

138 lines (101 loc) · 3.73 KB
from abc import ABC
from typing import Iterable, Sequence
import pytest
from docarray import DocumentArray, Document
from docarray.array.storage.base.getsetdel import BaseGetSetDelMixin
from docarray.array.storage.memory import BackendMixin, SequenceLikeMixin
class DummyGetSetDelMixin(BaseGetSetDelMixin):
    """Implement required and derived functions that power `getitem`, `setitem`, `delitem`"""
    # essentials
    def _del_doc_by_id(self, _id: str):
        del self._data[self._id2offset[_id]]
        self._id2offset.pop(_id)
    def _del_doc_by_offset(self, offset: int):
        self._id2offset.pop(self._data[offset].id)
        del self._data[offset]
    def _set_doc_by_id(self, _id: str, value: 'Document'):
        old_idx = self._id2offset.pop(_id)
        self._data[old_idx] = value
        self._id2offset[value.id] = old_idx
    def _get_doc_by_offset(self, offset: int) -> 'Document':
        return self._data[offset]
    def _get_doc_by_id(self, _id: str) -> 'Document':
        return self._data[self._id2offset[_id]]
    def _set_doc_by_offset(self, offset: int, value: 'Document'):
        self._data[offset] = value
        self._id2offset[value.id] = offset
    def _get_docs_by_slice(self, _slice: slice) -> Iterable['Document']:
        return self._data[_slice]
    def _set_docs_by_slice(self, _slice: slice, value: Sequence['Document']):
        self._data[_slice] = value
class StorageMixins(BackendMixin, DummyGetSetDelMixin, SequenceLikeMixin, ABC):
class DocumentArrayDummy(StorageMixins, DocumentArray):
    def __new__(cls, *args, **kwargs):
        return super().__new__(cls)
    def _load_offset2ids(self):
        pass
    def _save_offset2ids(self):
        pass
@pytest.fixture(scope='function')
def docs():
    return DocumentArrayDummy([Document(id=str(j), text=str(j)) for j in range(100)])
def test_index_by_int_str(docs):
    # getter
    assert len(docs[[1]]) == 1
    assert len(docs[1, 2]) == 2
    assert len(docs[1, 2, 3]) == 3
    assert len(docs[1:5]) == 4
    assert len(docs[1:100:5]) == 20  # 1 to 100, sep with 5
    # setter
    with pytest.raises(TypeError, match='an iterable'):
        docs[1:5] = Document(text='repl')
    docs[1:5] = [Document(text=f'repl{j}') for j in range(4)]
    for d in docs[1:5]:
        assert d.text.startswith('repl')
    assert len(docs) == 100
def test_getter_int_str(docs):
    # getter
    assert docs[99].text == '99'
    assert docs[-1].text == '99'
    assert docs[0].text == '0'
    # string index
    assert docs['0'].text == '0'
    assert docs['99'].text == '99'
    with pytest.raises(IndexError):
        docs[100]
    with pytest.raises(KeyError):
        docs['adsad']
def test_set_content_none():
    da = DocumentArray(
            Document(mime_type='image'),
            Document(mime_type='image'),
            Document(mime_type='text'),
    txt_da = da.find({'mime_type': {'$eq': 'image'}})
    assert len(txt_da) == 2
    txt_da.texts = ['hello', 'world']
    assert txt_da.texts == ['hello', 'world']
    assert da.texts == ['hello', 'world', '']
    da.tensors = None
    assert da.texts == ['hello', 'world', '']
def test_getter_from_docs():
    da = DocumentArray.empty(4)
    for i, d in enumerate(da):
        d.id = f'root{i}'
        chunks = DocumentArray.empty(2)
        for j, c in enumerate(chunks):
            c.id = f'chunk{j}_root{i}'
        matches = DocumentArray.empty(2)
        for j, m in enumerate(matches):
            m.id = f'match{j}_root{i}'
        d.chunks = chunks
        d.matches = matches
    assert len(da['@m']) == 8
    assert len(da['@m[:3]']) == 8
    assert len(da['@m[1:3]']) == 4
    assert len(da[:, 'id']) == 4
    assert len(da[...][:, 'id']) == 20
    assert len(da[..., 'id']) == 20
Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

test_base_getsetdel.py

Latest commit

History

test_base_getsetdel.py

File metadata and controls