OpenAI anunció el desarrollo de un modelo de lenguaje grande llamado GPT-Rosalind, específicamente capacitado en flujos de trabajo de biología comunes. El modelo, que lleva el nombre de la bióloga Rosalind Franklin, representa un enfoque especializado para el análisis de datos biológicos, que lo distingue de los modelos más genéricos que suelen emplear las principales empresas tecnológicas.

Yunyun Wang, líder de productos de ciencias biológicas de OpenAI, afirmó que GPT-Rosalind aborda obstáculos importantes en la investigación en biología. El primer desafío surge de los vastos conjuntos de datos producidos por décadas de secuenciación del genoma y bioquímica de proteínas. El segundo desafío implica la especialización de los numerosos subcampos de la biología, cada uno de los cuales se caracteriza por técnicas únicas y una jerga específica.

Por ejemplo, los genetistas pueden encontrar dificultades para navegar por la extensa literatura neurobiológica relacionada con genes específicos activos en las células cerebrales. Wang señaló que OpenAI capacitó a GPT-Rosalind en 50 de los flujos de trabajo biológicos más comunes y en el acceso a las principales bases de datos públicas de información biológica.

El modelo está equipado para sugerir posibles vías biológicas y priorizar objetivos farmacológicos. “Estamos conectando el genotipo con el fenotipo a través de vías y mecanismos reguladores conocidos, infiriendo probables propiedades estructurales o funcionales de las proteínas y realmente aprovechando esta comprensión mecanicista”, dijo Wang.

  Samsung lanza la aplicación Perplexity TV para televisores 2025

Crédito de imagen destacada