Модель искусственного интеллекта Kakao с открытым исходным кодом может интерпретировать как слова, так и изображения.

Image Description

Kakao впервые представила свою мультимодальную модель искусственного интеллекта «Honeybee» в пятницу на конференции, организованной Министерством науки и ИКТ. Однако гипермасштабируемая языковая модель KoGPT 2.0 технологического гиганта остается в секрете.

Будущий генеральный директор Kakao Чон Шин А представила исходный код, обсуждая предстоящие планы компании по разработке моделей и услуг искусственного интеллекта.

В конференции, посвященной государственной политике и сотрудничеству в области искусственного интеллекта, приняли участие руководители высшего звена из различных областей, связанных с платформами, телекоммуникациями, красотой, телевидением и робототехникой, а также руководители компаний Samsung, LG, Doosan Robotics, Naver и Amorepacific.

По данным исследовательской дочерней компании Kakao Brain, база кода Honeybee была передана разработчикам через GitHub в тот же день.

Сам исходный код не является большой языковой моделью (LLM), а скорее модулем, который можно подключить к другим большим языковым моделям. LLM, которые реализуют эту технологию, станут мультимодальными, получив возможность воспринимать как графические, так и текстовые подсказки.

Например, если пользователь передает фотографию двух баскетболистов на площадке в систему LLM, интегрированную с Honeybee, и спрашивает: «Сколько раз выигрывал игрок слева?» на английском языке модель могла понять изображение и текст, чтобы вызвать правильный ответ.

Компания Honeybee получила высший балл в тесте на функциональность нескольких глобальных протоколов оценки мультимодальности, включая MME, MMBench и SEED-Bench.

Kakao Brain считает, что Honeybee может стать инновационным инструментом обучения, поскольку он может взаимодействовать с пользователями, одновременно вводя определенное изображение и текстовый запрос, хотя точные варианты использования форм для Honeybee еще официально не указаны.

«Мы обсуждаем возможность адаптации Honeybee к различным услугам», — заявил в своем заявлении генеральный директор Kakao Brain Ким Иль До. «Мы будем прилагать больше усилий к исследованиям и разработкам (НИОКР), чтобы создать более совершенную модель ИИ».

Какао относительно поздно вступил в глобальную гонку за превосходство ИИ, которую в прошлом году катализировал ChatGPT OpenAI. Изначально Kakao обещала выпустить KoGPT 2.0 в прошлом году, но с тех пор постоянно откладывала его выпуск из-за различных обвинений, связанных с внутренними разногласиями и теневыми сделками, связанными с приобретением K-pop агентства SM Entertainment.

Корейские компании, такие как Naver, крупнейший в Корее портал, и LG AI Research в прошлом году запустили программы LLM HyperCLOVA X и Exaone соответственно. Эти модели адаптируются к различным услугам онлайн-платформ и финансовых компаний.

Источник: https://koreajoongangdaily.joins.com/news/2024-01-19/business/industry/Kakaos-opensource-AI-model-can-interpret-both-words-and-pictures/1962487