Российские химики создали крупнейшую базу данных растворимости соединений в бинарных смесях

23 апреля 2026г., 15:05

Ученые из Института общей и неорганической химии им. Н.С. Курнакова РАН (ИОНХ РАН), МГУ им. М.В. Ломоносова и НИУ «Высшая школа экономики» создали базу данных растворимости органических соединений в бинарных смесях растворителей MixtureSolDB и разработали онлайн-приложение для интерактивной визуализации данных. Представленная база с помощью ИИ позволяет прогнозировать значения растворимости веществ — параметра, необходимого при разработке лекарственных препаратов и создании материалов нового поколения.

Растворимость является одним из ключевых свойств соединений, определяющих их применение в химическом синтезе, материаловедении и фармацевтике. В технологических процессах зачастую используют смеси соединений, что существенно усложняет оценку их растворимости. Предсказание значений растворимости в смесях остается сложной задачей для современной хемоинформатики, прежде всего из-за отсутствия больших и разнообразных наборов экспериментальных данных.

Авторы создали самую большую в мире базу данных растворимости органических соединений в бинарных смесях растворителей, которая включает более 175 тысяч экспериментальных значений. Большинство предыдущих исследований были сосредоточены на растворимости в индивидуальных растворителях, тогда как MixtureSolDB впервые предоставляет масштабный систематизированный набор данных для бинарных смесей. Молекулярные структуры всех растворенных веществ и растворителей представлены в машиночитаемом формате SMILES — это позволяет напрямую использовать базу данных в задачах машинного обучения без дополнительной предобработки.

«В ходе работы мы обработали 1115 рецензируемых научных публикаций и систематизировали 175 166 экспериментальных значений растворимости для 810 органических соединений в 750 уникальных бинарных смесях растворителей при температурах от 252 до 383 K. Мы уделяли большое внимание качеству данных: каждая запись проходила проверку, стандартизацию и дедупликацию. Помимо самого набора данных, мы разработали онлайн-приложение для его визуализации и навигации. В нем можно искать значения растворимости как по химической структуре соединения, так и по его названию», — рассказал один из авторов исследования, младший научный сотрудник лаборатории кристаллохимии и Центра цвета ИОНХ РАН Лев Краснов.

В созданной базе данных представлены как наиболее распространенные бинарные системы, такие как вода — этанол, вода — ацетонитрил, этанол — ацетон, так и другие практически значимые комбинации.

По словам авторов, созданная база данных решает критическую проблему нехватки всеобъемлющих наборов данных для растворимости органических веществ в смесях растворителей, которая ранее существенно ограничивала развитие методов машинного обучения в этой области. Использование методов машинного обучения позволяет предсказывать свойства химических соединений без необходимости проведения экспериментов, что значительно ускоряет научный поиск и делает его дешевле. Это особенно важно для разработки инновационных химико-технологических процессов: точное знание растворимости в смесях растворителей критично для выбора условий синтеза, при разработке лекарственных форм и создании эффективных методов кристаллизации и экстракции.

Исследование выполнено при финансовой поддержке Минобрнауки России в рамках государственного задания ИОНХ РАН.

Источник: Официальный ресурс Министерства образования и науки Российской Федерации