You are on page 1of 27

Relaciones estructura-actividad cuantitativas (QSAR)

Los mtodos para correlacionar cuantitativamente caractersticas estructurales con actividad biolgica fueron introducidos por Hansch y Fujita en la dcada de 1960

Mapeo de receptores Optimizacin de potencia

Informacin sobre mecanismos

QSAR Nuevas ideas Diseo experimental en planificacin de series y optimizacin de sntesis

Bioisosterismo

La finalidad de QSAR es construir un modelo que permita predecir si un compuesto nuevo: ser activo o inactivo tendr una actividad x nM ser selectivo proveer nueva informacin tiene propiedades farmacocinticas (ADME) y nivel de toxicidad adecuados mejora nuestro conocimiento de las relaciones estructuraactividad y pemite mejorar nuestro modelo

Los estudios de correlaciones entre propiedades fsicas y propiedades qumicas o biolgicas, requieren disponer de datos biolgicos de calidad, definir descriptores qumicos relevantes y elegir un modelo adecuado para investigar las relaciones

Datos biolgicos

MODELO

Datos fisicoqumicos

Informacin

Ruido

Los datos biolgicos y fisicoqumicos pueden analizarse estadisticamente de dos formas: en forma conjunta o separada con mtodos clasificatorios de reconocimiento de tendencias usando tcnicas de regresin para establecer correlaciones cuantitativas

Entender y predecir propiedades

El punto inicial es la eleccin de


un conjunto de datos de entrenamiento o calibracin seleccionado en base a la diversidad estructural de los compuestos un conjunto de datos de prueba o validacin (grupo de compuestos que se reserva para la comprobacin del modelo y no se incluyen en su derivacin)

Pueden usarse datos biolgicos y bioqumicos desde muy precisos (KD) hasta muy aproximados (activo/inactivo, antagonista/agonista, etc)

Los datos estructurales pueden tomarse a distintos niveles, desde propiedades intrnsecas de la molcula no relacionadas a las interacciones hasta descripciones estricas-electrnicas como el potencial electrosttico mapeado sobre la superfice de Van der Waals

Los descriptores qumicos utilizados pueden tener informacin global (estructural) de la molcula o local para partes de la molcula (subestructuras) Las propiedades utilizadas pueden ser experimentales, calculadas o una combinacin de ambas PROPIEDADES

Biolgicas IC50 MIC LD50 Intrnsecas PM volumen rea superficial

Fisicoqumicas estricas electrnicas lipoflicas enlaces de H

Descriptores electrnicos
Los efectos electrnicos de un conjunto de sustituyentes en diferentes reacciones orgnicas son iguales (Hamett 1935) Si esos efectos pueden evaluarse en una reaccin standard, se podrn usar luego en cualquier reaccin El parmetro electrnico de sustituyente se determin en base a las constantes de disociacin de cidos benzoicos sustituidos:

= log KX - log KH

CO2H

CO2- + H+

KH, KX: constantes de ionizacin de cido benzico y de cidos benzicos sustiutidos en para o meta

depende de las condiciones de reaccin, = 1 en agua a 25C

> 0 representa sustituyentes atractores de electrones (CN, NO2, CF3) < 0 representa sustituyentes donores de electrones (NH2, CH3) grande indica que la reaccin es muy sensible a efectos de sustituyentes > 0 la reaccin se favorece por sustituyentes atractores de electrones < 0 la reaccin se favorece por sustituyentes donores de electrones

Las constantes meta (inductivo) y para (inductivo + resonancia) de un sustituyente en general no son iguales pueden expresarse como una combinacin lineal de un efecto de resonancia (R) y uno de campo (F) independientes de la posicin del sustituyente

=fF+rR

(f y r son factores de peso)

Descriptores lipoflicos
En forma anloga a la ecuacin de Hammett, se puede describir la constante de lipofilicidad de sustituyentes

= log PX - log PH
PX y PH son los coeficientes de particin entre un solvente orgnico y agua de un compuesto y su derivado sustituido con X. > 0 carcter lipoflico respecto de hidrgeno < 0 carcter hidroflico respecto de hidrgeno En la determinacin de coeficientes de particin debe tenerse en cuenta la ionizacin del compuesto en la fase acuosa El sistema 1-octanol/agua se usa como referencia. Una membrana segn sus caractersticas especficas puede ser modelada por otros solventes: inerte alcano

anfiprtica 1-octanol donor de protones cloroformo aceptor de protones dipelargonato de propilenglicol

La constante es aditiva y constitutiva (depende del entorno molecular). Los grupos alquilo y los sistemas conjugados son los menos constitutivos

Grupos atractores de electrones aumentan cuando hay puentes de hidrgeno involucrados por efecto inductivo

Los efectos de resonancia en sistemas aromticos disminuyen la capacidad de formar puentes de hidrgeno por deslocalizacin de los pares de electrones libres aumentando

Los efectos estricos son variables. Si un grupo interfiere con el acceso a pares de electrones libres que pueden formar puentes de hidrgeno con el agua, aumenta, pero el agrupamiento de grupos hidrofbicos tendr el efecto opuesto

Los efectos conformacionales tambin pueden afectar la lipofilicidad

la cadena aliftica se pliega sobre el anillo < superficie no polar > solubilidad en agua

(CH2)3 CH3 (CH2)3

X X

Efectos estricos
Pueden describirse mediante el parmetro estrico de Taft ES deriva de la hidrlisis cida de steres X-CH2-COOR cuanto ms voluminoso es X ms negativo es ES generalmente se toma ES = 0 para X = CH3 Un conjunto de parmetros que tienen mejor en cuenta la forma del sustituyente es el derivado por Verloop que utiliza un parmetro de longitud y cuatro de ancho:

Otro parmetro similar es el desarrollado por Charton


Charton et al; J. Org. Chem., 44, 2284 (1979)

La refractividad molar (MR) est directamente relacionada al volumen molar (PM/) por la ecuacin de Lorentz-Lorenz

MR = [(n2 - 1)/(n2 + 2)](PM/)

n = ndice de refraccin = densidad

MR es una propiedad aditiva de la molcula a mayor MR mayor es el volumen estrico del sustituyente y mayor su tendencia a interactuar a travs de fuerzas de London Este parmetro tambin mide el efecto electrnico y puede reflejar interacciones dipolo-dipolo en el sitio receptor

Anlisis de Hansch
En la dcada de 1960 Hansch y Fujita propusieron un mtodo para describir en forma cuantitativa relaciones entre la actividad biolgica y descriptores qumicos (correlacin lineal de energa libre)

Actividad biolgica = f (descriptores moleculares o de fragmentos)


Inicialmente utilizaron como descriptor la lipofilicidad considerando que generalmente se obtienen relaciones parablicas entre los coeficientes de particin o la lipofilicidad y la actividad biolgica, para una serie homloga de compuestos

log (1/C) = - k (log P)2 + k' (log P) + k"


Se utiliza la inversa de la concentracin C que genera algn tipo de respuesta (CE50, DL50, etc) como representacin de la actividad biolgica mayor potencia est asociada con una dosis menor

El ptimo es log P0 = k/2k

La ecuacin fue expandida para incorporar efectos electrnicos a travs del de Hammett

log (1/C) = - k (log P)2 + k' (log P) + + k"


k, k', y k" coeficientes de regresin derivados de un ajuste estadstico de datos

Posteriormente se incorporaron factores estricos (Es) y de forma (S) Se busca el mejor ajuste de cuadrados mnimos de la variable dependiente (la actividad biolgica) a una combinacin lineal de las variables independientes (los descriptores)

log (1/C) = - a 2 + b + + c Es + d S + e
La relacin de compuestos a descriptores debe ser > 5 Los descriptores no deben estar intercorrelacionados (coeficiente de correlacin entre descriptores < 0,5)
Se prueban ecuaciones con distintas combinaciones de parmetros una vez seleccionada la mejor que sea estadisticamente significativa, puede usarse para predecir la actividad de compuestos no ensayados

Descriptores qumicos tradicionales para algunos sustituyentes

Cuando hay ms variables (caractersticas estructurales) que compuestos o se deben correlacionar varias actividades biolgicas simultneamente
se requieren mtodos de regresin ms robustos que la regresin lineal mltiple se utilizan mtodos de reconocimiento de tendencias como proyecciones parciales de cuadrados mnimos o anlisis de componentes principales estos mtodos reducen la descripcin original de cada molcula en un nmero pequeo de dimensiones descriptivas llamadas componentes principales que son combinaciones lineales de las variables originales esto tolera entre otras cosas que el conjunto de descriptores qumicos est incompleto (datos faltantes para algunos compuestos)

El analisis de Hansch tiene varias debilidades:


al no saber que tomos interaccionan con el receptor puede ocurrir que algunos efectos estricos no sean importantes las reacciones usadas para derivar los descriptores generalmente son en medios cidos o bsicos donde los compuestos estn totalmente protonados o desprotonados mientras que en el medio biolgico las molculas suelen estar parcialmente protonadas Como los estudios de QSAR son empricos es una tcnica retrospectiva que depende de la actividad farmacolgica de compuestos que pertenecen al mismo tipo estructural de los utilizados, sirve para optimizar un lder pero no para descubrir uno nuevo Como en otros mtodos empricos las extrapolaciones generalmente fallan

y cuidado con la estadstica, todo puede ser correlacionado

seleccionar cuidadosamente las variables independientes las variables son significativas? mantener un nmero mnimo de compuestos por variable disponer de un modelo cualitativo

Mtodo de Free y Wilson


Permite la optimizacin de sustituyentes para un tipo de estructura base Supone que la introduccin de un sustituyente en una dada posicin en una molcula, cambia la potencia siempre en la misma magnitud independientemente de los otros sustituyentes presentes La actividad biolgica se representa como AB = log A/Ao
(A y Ao son las actividades del compuesto sustituido y sin sustituir)

Xi =1 si el sustituyente i esta presente y 0 si no lo est ai es la contribucin del sustituyente i a la actividad respecto de H es la actividad global del esqueleto sin sustituir

AB = ai Xi +

10

Una aplicacin a bloqueantes


Actividad antiadrenrgica de bromofenetilaminas

Matriz para anlisis de Free-Wilson

11

Anlisis de Free-Wilson
Posicin meta para H
0,00 0,00

F
-0,301 (0,50) 0,340 (0,30)

Cl
0,207 (0,29) 0,768 (0,30)

Br
0,434 (0,27) 1,020 (0,30)

I
0,579 (0,50) 1,429 (0,50)

CH3
0,454 (0,27) 1,256 (0,33)

= 7,821

n = 22, r2 = 0,94, s = 0,194

Ecuacin de Free Wilson log (1/CE50) = - 0,301 [m-F] + 0,207 [m-Cl] + 0,434 [m-Br] + 0,579[m-I] + 0,454[m-Me] + 0,340[p-F] + 0,768[p-Cl] + 1,020[p-Br] + 1,429[p-I] + 1,256[p-Me] + 7,821 n = 22, r = 0,97, s = 0,194

El mtodo puede aplicarse a compuestos quirales En los racematos se asigna 0,5 a cada columna

12

Inconvenientes del mtodo


En muchos casos hay un nmero muy grande de parmetros lo cual impide el uso de regresin lineal mltiple (pueden aplicarse mtodos de reconocimiento de tendencias) El mtodo es estrictamente interpolativo Todos los sustituyentes y caractersticas estructurales son considerados con la misma disimilitud (la diferencia entre metilo y etilo equivale a priori a la diferencia entre metilo y amino, etc) No da ideas de las razones fisicoqumicas por las que alguna caracterstica estructural puede ser favorable o desfavorable

Arbol de decisin de Topliss y grficos de Craig


Son mtodos manuales, no matemticos y no estadsticos que siguen los principios del anlisis de Hansch Buscan una optimizacin eficiente de un compuesto lder minimizando el nmero de compuestos a sintetizar Estn basados en los descriptores y y en menor medida en ES El grfico de Craig representa dos descriptores seleccionados, como por ejemplo vs para distintos sustituyentes

13

El signo y magnitud de los coeficientes de y (de ec. de Hansch) determina el cuadrante del grfico a usar en las sntesis de nuevos anlogos.

Tambin se pueden seleccionar sustituyentes de distintos cuadrantes de modo de cubrir un amplio rango de propiedades: lipoflico e hidroflico, donores y atractores de electrones P. Craig, J. Med. Chem. 14, 680 (1971)

P. Craig, J. Med. Chem. 14, 680 (1971)

14

El mtodo de Topliss sigue un esquema intuitivo basado en un rbol de decisin


El prerequisito es que el compuesto lder debe tener un anillo bencnico no fusionado Partiendo de un compuesto bencnico no sustituido:

SO2NH2
Como el aumento en lipofilicidad generalmente aumenta la potencia el primer anlogo debe ser uno con un sustituyente con > 0. 4-cloro tiene = 0,71 y = 0,23 es una buena eleccin inicial Si la potencia aumenta puede deberse al mayor , al mayor o a ambos entonces el siguiente paso es poner un cloro en meta. Si el 3,4-dicloro ( = 1,25 y = 0,52) es ms activo puede discriminarse entre efecto y con el sustituyente S-Ph en para ( = 2,32 y = 0,18) o el 3trifluorometil-4-nitro ( = 0,60 y = 1,21)
J. Topliss, J. Med. Chem. 15, 1007 (1972)

De esta forma se construye un rbol de decisin


4-H < 4-Cl = 4-Cl > 4-Cl < = =0,71, =0,23 > 3,4-Cl2

> = 4-OMe 4-OMe 4-OMe =-0.04, =-0,27

<

> = 4-Me 4-Me 4-Me =0,56, =-0,17 <

3,4-Cl 2 3,4-Cl2 =1,25, =0,52 <

< 4-NO2

= 4-NO2

> 4-NO2

> 4-S-Ph

=-0,28, =0,78

=2,32, =0,18 <

>

Topliss extendi el esquema a cadenas laterales cuando el grupo es adyacente a carbonilo, amino o amida y puede aplicarse a otras situaciones que no impliquen sustitucin directa sobre el anillo aromtico El principal inconveniente del mtodo de Topliss asi implementado es que es secuencial

15

Un esquema alternativo usa un anlisis batch de pequeos grupos de compuestos. Para ello los sustituyentes se agrupan segn , , 2, y combinaciones lineales de y . Se sintetizan el anlogo sin sustituir y 4 derivados:

Se los ordena en orden de potencia decreciente y se determina que parmetros son dominantes Ej: 4-MeO > 4-Me > H > 4-Cl > 3,4-Cl2 domina

Una vez determinada la dependencia de los parmetros se eligen nuevos sustituyentes segn

16

Una extensin no manual introducida por Hansch agrupa en clusters los sustituyentes con propiedades similares segn , , 2, ES, F, R, MR y PM

Metodologas QSAR-3D
El anlisis de Hansch y los mtodos de reconocimiento de tendencias usualmente no tienen en cuenta la estructura tridimensional de los compuestos de una manera explcita Las metodologas que tienen en cuenta explicitamente la geometra 3D se denominan QSAR-3D. Los 2 mtodos ms usados son:
CoMFA: Comparative Molecular Field Analysis hace un mapa 3D de interacciones electrostticas y estricas de los ligandos en estudio que luego se correlacionan con la actividad biolgica Cramer et al, J. Am . Chem. Soc., 110, 5959 (1988) CoMSIA: Comparative Molecular Similarity Index Analysis calcula ndices de similitud para un conjunto de molculas previamente alineadas con respecto a propiedades fisicoqumicas (interacciones de distintos tipos, puentes H, etc). Esos ndices luego se correlacionan con la actividad Klebe et al, J . Med. Chem., 37, 4130 (1994)

17

CoMFA
incluye las siguientes etapas: identificacin de la conformacin activa regla de alineacin (crtico cuando se utilizan estructuras muy distintas) construccin de una grilla 3D (puntos separados 1-2 ) clculo de las interacciones de Van der Waals y electrostticas en cada punto respecto de un tomo de prueba sp3 con carga +1 (los campos) seleccin de un grupo de entrenamiento o calibracin anlisis por el mtodo de cuadrados mnimos parciales validacin cruzada con un grupo de compuestos no usados los juegos de coeficientes para los campos de Van der Waals y electrostticos se representan como mapas de contorno

CoMSIA
parte de un conjunto prealineado y busca similitudes con distintos campos Generalmente se utilizan interacciones electrostticas, estricas, hidrofbicas, aceptoras de puente H y donoras de puente H

Publicaciones aplicando CoMFA en 1988-2007

18

caja y grilla en CoMFA

En un estudio sobre 30 esteroides con afinidad por la globulina afn a corticosteroides (CBG) se usaron 21 como juego de calibracin y una grilla de puntos separados 1,5 .

19

Una vez calculados los campos cada esteroide qued definido por 4704 variables El mapa de contorno electrosttico negativo indica la zona donde es favorable la presencia de grupos con densidad electrnica negativa (3-ceto) Los esteroides con un sustituyente ms positivo como OH tienen menor afinidad

Grilla 3D

Contorno de campo electrosttico negativo

mapa CoMFA estrico

20

mapa CoMFA electrosttico

CoMSIA
incluye las siguientes etapas: identificacin de la conformacin activa regla de alineacin (crtico cuando se utilizan estructuras muy distintas) construccin de una grilla 3D (puntos separados 1-2 ) a diferencia de CoMFA evala la similitud en la respuesta a una sonda determinada para el conjunto de molculas la sonda puede evaluar cualquier propiedad fisicoqumica pero generalmente se utilizan interacciones electrostticas, estricas, hidrofbicas, aceptoras de puente H y donoras de puente H seleccin de un grupo de entrenamiento o calibracin anlisis por el mtodo de cuadrados mnimos parciales validacin cruzada con un grupo de compuestos no usados los juegos de coeficientes para los campos evaluados se representan como mapas de contorno

21

Coeficiente CoMSIA para propiedades electrostticas


reas grises corresponden a zonas donde mayor carga negativa mejora la afinidad reas negras corresponden a zonas donde mayor carga positiva mejora la afinidad

Coeficiente CoMSIA para propiedades estricas


reas grises corresponden a zonas donde mayor volumen estrico mejora la afinidad reas negras corresponden a zonas donde mayor volumen estrico disminuye afinidad

22

comparacin de potenciales CoMFA y CoMSIA


CoMFA utiliza cortes en los valores de los potenciales para evitar valores exageradamente grandes al aproximarse (o introducirse) en una molcula CoMSIA tiene campos definidos por similitud y aplica una aproximacin Gaussiana que no produce cortes bruscos ni discontinuidades

Campos de interaccin de antagonistas de 5-HT2 con un CH aromtico (hidrofbico) y con un OH aliftico (donor y aceptor de puente hidrgeno)

23

Limitaciones de QSAR-3D
Los modelos pueden predecir en el espacio 3D cubierto por las estructuras de calibracin: si una posicin solo tiene metilo y etilo no se puede predecir el efecto de alquilos mayores

Ventajas de QSAR-3D
El mismo protocolo puede ser aplicado a distintos problemas El mtodo puede manejar grupos de compuestos estructuralmente distintos y predecir nuevos compuestos con caractersticas que no existan en el conjunto de calibracin Los mapas de contorno tienen relacin directa con las interacciones importantes droga-receptor Si se conoce la estructura del receptor y las estructuras se alinean ubicndolas en el sitio activo, los mapas de contorno resultantes coincidirn con los aminocidos del receptor importantes para la unin y proveern informacin sobre cuales son las interacciones principales

Mapeo de receptores
Los datos de los campos de interaccin permiten construir un mapa detallado de los potenciales de interaccin molecular sustituyentes hidrofbicos en la parte superior mejoran la afinidad Para afinidad a 5HT2 se requiere un centro aromtico (regin 1) a 6,6 de un nitrgeno protonable

Un rea hidrofbica (regin 2) prxima al centro aromtico aumenta la afinidad.

A partir de esos datos se puede construir un mapa del receptor

24

Deben ubicarse aminocidos hidrofbicos como PHE, TRI, VAL, LEU, ILE a los lados del sistema planar de anillos Un aminocido acdico (asprtico) debe ubicarse opuesto al N protonado

Las constantes de unin pueden correlacionarse con las energas de interaccin

25

Con esa correlacin pueden predecirse afinidades de nuevas estructuras

Anlisis de Free - Wilson


fcil de hacer separacin clara entre los efectos de distintos sustituyentes necesita al menos dos sitios de variacin de sustituyentes puede requerir muchas variables no puede extrapolar

Anlisis de Hansch
correlaciona actividades con propiedades fisicoqumicas admite cierto grado de extrapolacin slo aplicable a series de congneres funciona mejor con variacin de sustituyentes en aromticos no tiene en cuenta estructura 3D riesgo de correlaciones por azar riesgo de error si se extrapola a etructuras muy alejadas del conjunto inicial

26

3D-QSAR (CoMFA y CoMSIA)


considera estructura 3D aplicable a conjuntos de estructuras dismiles considera campos estricos, electrostticos, hidrofbicos y de puentes de H generan mapas de interacciones favorables y desfavorables incertidumbre sobre la conformacin activa incertidumbre sobre los modos de unin de diferentes ligandos alto riesgo de correlaciones por azar solo aplicable a datos de actividad in vitro

27