Учёные из Института общей и неорганической химии им. Н.С. Курнакова РАН, Высшей школы экономики, МГУ им. М.В. Ломоносова и Венского университета создали самую крупную в мире базу данных растворимости органических соединений в неводных растворителях — BigSolDB 2.0. В неё вошло более 100 тысяч экспериментальных значений, полученных из анализа почти 1600 научных статей, что позволяет использовать её для построения точных моделей машинного обучения. Об этом «Жуковский.Life» рассказали в пресс-службе РАН.
Растворимость является ключевым параметром в химии, материаловедении и фармацевтике, но её прогнозирование, особенно в неводных растворителях, долгое время оставалось серьёзной проблемой из-за недостатка качественных и объёмных данных.
BigSolDB 2.0 заполняет этот пробел, предоставляя данные для 1448 органических веществ в 213 растворителях при температурах от 243 до 425 К, что расширяет возможности предсказания свойств химических соединений без необходимости в лабораторных экспериментах.
Все структуры соединений и растворителей были стандартизированы и представлены в машиночитаемом формате SMILES, а данные переписаны в логарифмические единицы LogS, что облегчает использование при обучении моделей.
Для удобства работы с базой была разработана онлайн-платформа с возможностью интерактивного поиска и визуализации по структурам и названиям веществ.
BigSolDB 2.0 охватывает широкий спектр растворителей: низкомолекулярные спирты, воду, этилацетат, ацетон, ацетонитрил и другие. Это важно для выбора растворителей в синтезе и исследовании лекарств, а также для оптимизации процессов экстракции и кристаллизации в промышленности. Создание этой базы решает проблему нехватки комплексных данных и значительно ускоряет разработку новых материалов и химических препаратов с помощью методов машинного обучения.
Учёные разработали новый метод синтеза бициклических диазиридинов. Главное преимущество разработанного отечественными химиками метода – использование N-хлорсукцинимида в качестве удобного и безопасного хлорирующего агента.
