NanoMINER ускоряет исследование наноматериалов

Фото сгенерировано Kandinsky 4.1
Система самостоятельно обрабатывает полный контент статей, выделяя сведения о составе, свойствах и условиях синтеза.

Ученые из ИТМО и МГУ создали мультиагентную систему NanoMINER, которая автоматизирует извлечение и обработку информации из научных статей по наноматериалам и нанозимам. Время анализа статьи системой сокращается до одной минуты вместо 90 минут при ручном просмотре. NanoMINER достигает точности обработки данных до 98%, что значительно ускорит исследования в материаловедении, биотехнологиях и смежных областях.

Ключевая проблема в изучении наноматериалов заключается в том, что важная информация обычно содержится в неструктурированном виде — смешаны текст, таблицы и графики. Ручной сбор данных отнимает много времени и мешает созданию масштабных баз данных. Существующие автоматизированные решения часто ограничены только текстовым анализом или требуют постоянного вмешательства человека, что снижает их эффективность.

NanoMINER решает эти проблемы, объединяя работу нескольких моделей: GPT-4o для анализа текстовой информации и YOLO для распознавания изображений и графиков. Система самостоятельно обрабатывает полный контент статей, выделяя сведения о составе, свойствах и условиях синтеза наноматериалов, а также способна прогнозировать тип кристаллической решетки по формуле.

Проверка системы на 20 ранее исследованных статьях показала высокую точность: до 98% для кинетических параметров нанозимов и 66% для молекулярных характеристик наноматериалов, что говорит о надежности и полноте извлеченной информации.

Программа свободно доступна, ее исходный код и инструкции опубликованы в открытом доступе, что позволяет исследователям самостоятельно использовать NanoMINER для обработки данных из любых научных публикаций. По словам разработчиков, система будет улучшаться, включая расширение тематики, повышая точность и адаптируясь для применения в биомедицине и других сферах. В дальнейшем она может стать основой для создания автоматизированных, постоянно обновляемых баз данных научных знаний.

Как правильно собирать данные для нейросети? Авторы нового набора практических инструкций рассказывают, как и где лучше брать данные для создания такой базы.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Загрузка ...
Жуковский Life

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: