Španělský startup Nuclia dostane 5,4 milionu dolarů na pokročilé vyhledávání nestrukturovaných dat

1
Španělský startup Nuclia dostane 5,4 milionu dolarů na pokročilé vyhledávání nestrukturovaných dat

Spuštění vyhledávání pomocí umělé inteligence Nuclia dnes oznámila, že získala 5,4 milionu dolarů v počátečním kole financování vedeném Crane Venture Partners a Ealai.

Kolo umožní společnosti navázat na spuštění své open-source a cloudové nativní databáze NucliaDB. Oficiálně nazvaná Bosutech SL, Nuclia také oznámila veřejnou dostupnost svého aplikačního programovacího rozhraní, které umožňuje vývojářům integrovat extrémně účinné vyhledávání založené na umělé inteligenci do jakékoli aplikace, služby nebo webové stránky.

To, co společnost Nuclia vybudovala, je řešení založené na umělé inteligenci pro vyhledávání nestrukturovaných dat a zdá se, že jde o velký problém. V dnešní době si každá společnost vybudovala obrovské množství dat, ale Drtivá většina z těchto informací – kolem 80 % až 90 %, říká Nuclia – je nestrukturovaných, ve formě nečitelných textových dokumentů, jako jsou PDF nebo video či audio soubory. Až dosud bylo přesné vyhledávání v tomto druhu dat vždy velkou výzvou.

Problém je v tom, že většina společností jednoduše nemá schopnost všechna tato nestrukturovaná data zpracovat, zpracovat a indexovat. Jak zdůrazňuje Nuclia, splnění byť jen malé části této výzvy si vyžádalo stovky inženýrů a výpočty v hodnotě milionů strojů.

Se spuštěním Nuclia’s API a NucliaDBstartup tvrdí, že tento druh moci je nyní k dispozici komukoli. NucliaDB, kterou najdete na GitHub, je základem schopností Nuclia. Společnost tvrdí, že je to první vektorová databáze, která je speciálně navržena pro nestrukturovaná data.

Vektorové databáze jsou navrženy tak, aby zvládly jedinečnou strukturu vektorových vložení. Indexují nestrukturovaná data jako vektory, které lze snadno vyhledávat a získávat porovnáním hodnot a nalezením těch, které jsou si navzájem nejvíce podobné.

Společnosti mohou využívat NucliaDB prostřednictvím Nuclia API, které se může rychle připojit k jakémukoli datovému zdroji a automaticky indexovat jeho obsah bez ohledu na to, v jakém formátu nebo dokonce jazyce je. Eudald Camprubí, zakladatel a výkonný ředitel Nuclia, řekl SiliconANGLE, že Nuclia API umožňuje uživatelé mohou provádět vícejazyčné sémantické vyhledávání v celém jejich nestrukturovaném souboru dat a převádět tyto informace na znalosti.

„Rozhraní API společnosti Nuclia umožňuje vývojářům integrovat vyhledávání založené na umělé inteligenci normalizací nestrukturovaných dat,“ vysvětlil Camprubí a dodal, že to zahrnuje přepis videa a zvuku, extrahování veškerého obsahu z obrázků, dokumentů a dalších textových informací. “Vektorizuje všechna tato data a vytváří index, který lze prohledávat.”

Jakmile jsou všechna tato nestrukturovaná data indexována, mohou vývojáři použít Nuclia API k objevování sémantických výsledků, konkrétních odstavců v textu a vztahů mezi daty. Tyto funkce lze snadno integrovat do jakékoli aplikace, řekl Camprubí.

Partner Crane Venture Aneel Lakhani byl plný chvály na společnost a řekl, že Nuclia vytvořila „něco neuvěřitelného“, co uživatelům umožní dostat se přesně do okamžiku, který hledají ve videu nebo podcastu, nebo na přesný blok textu, který ‘hledejte v prezentaci PDF nebo PowerPoint.

Analytik Constellation Research Inc Andy Thurai byl ve svém hodnocení praktičtější. Řekl, že SiliconANGLE Nuclia řeší problém, který má mnoho společností, a to ten, že vlastní mnohem více nestrukturovaných dat, než s čím skutečně vědí. Protože tyto informace nejsou snadno čitelné, mají prostě tendenci je uchovávat na dobu neurčitou v naději, že jednoho dne budou schopni přijít na to, co s nimi dělat, řekl. Ačkoli je Nuclia v mnoha ohledech jen dalším účastníkem ve velmi přeplněném poli startupů, které se všechny snaží tento problém vyřešit, Thurai řekl, že má několik funkcí, které mohou být pro podniky užitečné.

„Zaprvé, jejich vyhledávání může být zcela založené na API. Jakmile jsou připojeny správné zdroje dat, jakákoli aplikace může použít veřejně dostupné API Nuclia k vyhledávání nestrukturovaných dat,“ řekl Thurai. “Zadruhé mohou dělat vícejazyčné vyhledávání pomocí textového vyhledávacího pole, takže tímto způsobem se snaží být Googlem pro vyhledávání nestrukturovaných dat.”

Thurai řekl, že tvrzení společnosti Nuclia, že je schopna detekovat obrázky v nestrukturovaných souborech dat, je také jedinečné. Například říká, že dokáže najít vložený obrázek v naskenovaném dokumentu. Dále společnost také tvrdí, že je schopna provádět „fuzzy vyhledávání“ na nestrukturovaných datech. Thurai vysvětlil, že to znamená, že může vyhledávat věty, které úzce odpovídají tomu, co uživatel hledá, na rozdíl od hledání přesné shody.

“Tato poslední schopnost je jedinečná v oblasti vyhledávání nestrukturovaných dat,” řekl Thurai. „Může to potenciálně vést k novým technikám klasifikace obrázků a videí, takže bychom mohli říci, že jedno video je X % podobné jinému a tak dále. Mohlo by to být také velmi užitečné při ochraně autorských práv na hudbu, snímky, hudební videa a další.“

Obrázek: Nuclia

Ukažte svou podporu našemu poslání tím, že se připojíte k našemu klubu Cube Club a komunitě odborníků Cube Event Community. Připojte se ke komunitě, která zahrnuje Amazon Web Services a generálního ředitele Amazon.com Andyho Jassyho, zakladatele a generálního ředitele společnosti Dell Technologies Michaela Della, CEO společnosti Intel Pat Gelsingera a mnoho dalších osobností a odborníků.

podobné příspěvky

Leave a Reply