Datasaur позволяет автоматически строить модель из набора меток.
Задолго до того, как люди заговорили о ChatGPT и генеративном искусственном интеллекте, такие компании, как Datasaur, разбирались в тонкостях построения моделей машинного обучения, помогая маркировать вещи для обучения модели. С развитием ИИ такого рода возможности стали еще более важными.
Чтобы предоставить возможность создания моделей большему количеству компаний без специалиста по науке о данных, Datasaur объявила о возможности создания модели непосредственно на основе данных этикетки, что делает создание модели доступным для гораздо менее технической аудитории. Он также объявил о продлении начального периода на 4 миллиона долларов, которое завершилось в декабре прошлого года.
Основатель компании Иван Ли говорит, что недавний всплеск интереса к искусственному интеллекту пошел на пользу компании и на самом деле хорошо вписывается в стратегию стартапа. «Datasaur всегда стремился быть лучшим местом для сбора обучающих данных, которые вам нужны для использования в ваших моделях, будь то LLM или традиционные модели NER, анализ настроений или что-то еще», — сказал Ли TechCrunch.
«Мы — лучший интерфейс для нетехнических пользователей, которые могут приходить и маркировать эти данные», — сказал он.
Рост числа LLM помогает повысить осведомленность в целом о том, как ИИ может помочь в бизнес-контексте, но он говорит, что большинство компаний все еще находятся на стадии исследований, и им все еще нужны такие продукты, как Datasaur, для создания моделей. Ли говорит, что одной из его целей с самого начала была демократизация ИИ, особенно в области обработки естественного языка, и новая функция построения моделей должна сделать ИИ доступным для большего числа компаний, даже тех, у которых нет специального опыта.
«И эта функция меня особенно радует, потому что она позволяет командам без специалистов по данным и без инженеров просто размечать и маркировать эти данные так, как они считают нужным, и она просто автоматически обучает для них модель», — сказал Ли. .
Ли видит в этом способ выйти за пределы первоначального целевого рынка специалистов по данным. «Теперь мы собираемся открыть его для строительных компаний, юридических фирм, маркетинговых компаний, которые, возможно, не имеют опыта работы с данными, но все равно могут создавать модели НЛП [на основе данных своего обучения]».
Он говорит, что смог ограничить объем венчурных инвестиций, которые он взял (предыдущий стартовый капитал составлял скромные 3,9 миллиона долларов в 2020 году), потому что он работает экономно. Его инженерная команда находится в основном в Индонезии, и, хотя он рассчитывает нанять сотрудников, он гордится тем, что компания работает эффективно.
«Моей философией всегда была прибыльность, масштабируемый рост и никогда не расти любой ценой», — сказал Ли. Это означает, что он учитывает каждый прием на работу и его влияние на бизнес.
Имея удаленную межкультурную рабочую силу, сотрудники могут учиться друг у друга, и это по своей природе вносит разнообразие в компанию. «Существует значительная разница в культуре труда в США и в Индонезии. И поэтому мы должны были намеренно запечатлеть лучшее из обоих миров», — сказал он. Это может означать поощрение индонезийских коллег высказываться или опровергать то, что говорит менеджер, а это то, чего они не хотят делать с культурной точки зрения. «Мы очень активно поощряли это», - сказал он.
Но он говорит, что американские сотрудники могут многое узнать о том, как обстоят дела в Азии, например, об уважении к своим коллегам и культуре, когда команда ставится на первое место, и ему приходилось помогать командам преодолевать эти культурные различия.
Инвестиции в размере 4 миллионов долларов были осуществлены компанией Initialized Capital при участии HNVR, Gold House Ventures и TenOneTen. Всего компания привлекла $7,9 млн.