Professional Documents
Culture Documents
ModellingTransport-161-195 en Es
ModellingTransport-161-195 en Es
com
4
Modelado de generación de viajes
Como vimos en el Capítulo 1, la etapa de generación de viajes del modelo de transporte clásico tiene como objetivo
predecir el número total de viajes generados por (Oi) y atraído por (Dj) cada zona del área de estudio. Esto se puede
conseguir de varias formas: empezando por los viajes de las personas u hogares que residen en cada zona o
directamente con algunas de las propiedades de las zonas: población, empleo, número de coches, etc. También se ha
tratado el tema visto como unfrecuencia de viajeproblema de elección: ¿cuántos viajes de compras (u otros fines)
realizará este tipo de persona durante una semana representativa? Esto generalmente se lleva a cabo utilizando modelos
de elección discreta, como se analiza en los capítulos 7 a 9, y luego se expresa en términos como: ¿cuál es la probabilidad
de que este tipo de persona realice cero, uno, dos o más viajes con este propósito por semana?
En este capítulo nos concentramos en el primer enfoque (es decir, predecir los totalesOiyDja partir de datos sobre los
atributos socioeconómicos de los hogares), y también dan una idea sobre el segundo que tiene ventajas en algunos
estudios.
Comenzaremos definiendo algunos conceptos básicos y procederemos a examinar algunos de los factores que inciden
en la generación y atracción de viajes. Luego revisaremos los principales enfoques de modelado, comenzando con la
técnica más simple del factor de crecimiento. Antes de embarcarnos en enfoques más sofisticados, presentaremos una
revisión razonable del modelo de regresión lineal, que complementa bien los temas estadísticos anteriores presentados
en los Capítulos 2 y 3.
A continuación, consideraremos los modelos de generación de viajes de regresión lineal basados en zonas y
hogares, dando cierto énfasis al problema de las no linealidades que a menudo surgen en este caso. También
abordaremos por primera vez el problema de la agregación (por ejemplo, la obtención de totales zonales), que
aquí tiene una solución trivial precisamente por la forma lineal del modelo. Luego pasaremos a los modelos de
clasificación cruzada, donde examinaremos no solo la especificación de análisis de categoría clásica, sino
también enfoques más modernos, incluido el modelo de análisis de categoría de persona. Luego examinamos la
relación entre la generación de viajes y la accesibilidad, incluida una breve discusión sobre los modelos de
frecuencia de viajes. El capítulo termina con dos secciones cortas: la primera discute el problema de predecir
valores futuros para las variables explicativas en los modelos,
4.1 Introducción
4.1.1 Algunas definiciones básicas
Como siempre, las definiciones juegan un papel importante en nuestra comprensión de cualquier fenómeno. Viajar no es diferente.
La pregunta es, ¿cuál es el evento básico de interés para nuestros modelos, actividades que involucran un corto
período de estancia en un lugar (estancia), el desplazamiento de un lugar a otro (viaje o jornada), o una secuencia de tales
viajes y estancias que empiezan y terminan en casa y constituyen una salida o un recorrido? ¿Qué pasa con los tours que
no se basan en casa? El modelador debe tener en cuenta todas estas opciones al decidirse por un conjunto de la siguiente
lista para desarrollar y aplicar un conjunto de modelos.
viaje o viajeEste es un movimiento de un solo sentido desde un punto de origen hasta un punto de destino. Normalmente nos
interesan todos los viajes vehiculares. Los recorridos a pie inferiores a un cierto umbral definido por el estudio (por ejemplo, 300
metros o tres cuadras) a menudo se han ignorado, así como los recorridos realizados por bebés menores de cinco años. Sin
embargo, este énfasis está cambiando con una mayor atención que se presta a los viajes no motorizados y, como se discutió en el
capítulo anterior, debido a los requisitos del marco de actividad de retiro recomendado para las encuestas de movilidad.
Viaje basado en el hogar (HB)Este es uno donde el hogar del viajero es el origen o el destino del viaje. Tenga en
cuenta que para los visitantes de otra ciudad, su hotel actúa como un hogar temporal en la mayoría de los
estudios.
Viaje no basado en el hogar (NHB)Este, por el contrario, es aquel en el que ninguno de los extremos del viaje es el hogar
del viajero.
Viaje Atracción Esto se define como el final fuera del hogar de un viaje HB o el destino de un viaje NHB
(ver Figura 4.1).
Generación de viajes Esto a menudo se define como el número total de viajes generados por los hogares en una zona,
ya sean HB o NHB. Esto es lo que producirían la mayoría de los modelos y queda entonces la tarea de asignar viajes NHB
a otras zonas como producciones de viaje.
MorarUn breve período de estancia en un lugar determinado. Suele tener un propósito asociado a esta estancia:
trabajo, estudio, compras, ocio, etc.
ActividadUn esfuerzo o interés a menudo asociado con un propósito como el anterior pero no necesariamente
vinculado a una ubicación fija. Se podía optar por ir de compras o al cine en diferentes lugares.
Tour o cadena de viajeUn conjunto de estancias y viajes vinculados. Los últimos tres conceptos se corresponden mejor con la idea de viajar
como demanda derivada (es decir, depende en gran medida de la demanda de otras actividades), pero inicialmente fueron utilizados
principalmente por modeladores de elección discreta en la práctica (ver Dalyy otros. 1983). Los modelos contemporáneos, en particular los del
tipo de frecuencia de viaje, suelen estar más interesados en los recorridos.
Modelado de generación de viajes 141
Se ha encontrado en la práctica que se puede obtener una mejor comprensión de los modelos de viajes y generación de
viajes si los viajes por diferentes propósitos se identifican y modelan por separado. En el caso de los viajes en MP, se han
empleado una serie de categorías:
Los dos primeros suelen denominarse viajes obligatorios (u obligatorios) y todos los demás se denominan viajes
discrecionales (u opcionales). La última categoría engloba todos los viajes realizados con fines menos rutinarios, como
salud y negocios personales (necesidad de obtener un pasaporte o un certificado). Tenga en cuenta que los contextos
sociales y culturales pueden cambiar la importancia de los diferentes tipos de viajes y, por lo tanto, la clasificación más
adecuada. Los viajes de NHB a veces se separan en "por negocios" y "otros", pero a menudo se mantienen como una sola
categoría porque solo representan el 15-20% de todos los viajes totales.
períodos. En tercer lugar, también se revela claramente un problema causado por una clasificación defectuosa, o falta de
previsión en la etapa de codificación de datos: lavuelve a casalos viajes (que suponen el 41,65% del total de viajes fuera de
horas punta) son obviamente viajes con otra finalidad; el hecho de que regresaran a casa no es tan importante como el
motivo por el que se fueron de casa en primer lugar. De hecho, estos datos necesitaban recodificarse para obtener
información adecuada para el modelado de generación de viajes (ver Hally otros. 1987). Este tipo de problemas solía
ocurrir antes de que los conceptos de producción de viajes y atracciones reemplazaran conceptos como orígenes y
destinos, que no abordaban explícitamente la capacidad de generación de actividades en el hogar y fuera del hogar.
Esta es otra clasificación importante, ya que el comportamiento de viaje individual depende en gran medida de los
atributos socioeconómicos. Generalmente se emplean las siguientes categorías:
- nivel de ingresos (por ejemplo, tres estratos: ingresos bajos, medios y altos);
- propiedad de automóviles (típicamente tres estratos: 0, 1 y 2 o más automóviles);
- tamaño y estructura del hogar (por ejemplo, seis estratos en los estudios británicos clásicos).
Es importante tener en cuenta que el número total de estratos puede aumentar muy rápidamente (por ejemplo, 54 en
el ejemplo anterior) y esto puede tener fuertes implicaciones en términos de requisitos de datos, calibración y uso del
modelo. Por esta razón, generalmente se requieren compensaciones, ajustes y agregaciones (ver la discusión en Daly y
Ortúzar 1990).
En el modelado de generación de viajes, normalmente nos interesan no solo los viajes de personas, sino también los viajes de
carga. Por esta razón, generalmente se han requerido modelos para cuatro grupos principales (es decir, personal y carga,
producciones de viajes y atracciones). En lo que sigue consideraremos brevemente algunos factores que han resultado importantes
en los estudios prácticos. Sin embargo, no discutiremos el modelado de generación de viajes de carga (aunque se había hecho un
poco a finales de siglo), sino que pospondremos una discusión sobre el tema general del modelado de demanda de carga hasta el
Capítulo 13.
Se han propuesto los siguientes factores para su consideración en muchos estudios prácticos:
- ingreso;
- propiedad del carro;
-
- estructura del hogar;
tamaño de la familia;
- valor de la tierra;
- densidad residencial;
- accesibilidad.
Los primeros cuatro (ingresos, propiedad de automóviles, estructura del hogar y tamaño de la familia) se han considerado en
varios estudios de generación de viajes en el hogar, mientras que el valor de la tierra y la densidad residencial son típicos de los
estudios zonales. El último, la accesibilidad, rara vez se ha utilizado aunque muchos estudios han intentado incluirlo. La razón es
que ofrece una forma de hacer que la generación de viajes sea elástica (sensible) a los cambios en el sistema de transporte;
Volveremos sobre este tema en la sección 4.3.
Modelado de generación de viajes 143
El factor más utilizado ha sido el espacio techado disponible para servicios industriales, comerciales y otros. Otro
factor utilizado ha sido el empleo zonal, y algunos estudios han intentado incorporar una medida de
accesibilidad. Sin embargo, es importante señalar que en este caso no se han reportado muchos avances.
Estos normalmente representan pocos viajes vehiculares; de hecho, como mucho representan el 20% de todos los viajes
en ciertas áreas de los países industrializados, aunque aún pueden ser significativos en términos de su contribución a la
congestión. Las variables importantes incluyen:
- Número de empleados;
- número de ventas;
- área techada de firme;
- superficie total de la empresa.
Hasta donde sabemos, ni la accesibilidad ni los tipos de empresa se han considerado nunca como variables
explicativas; esto último es curioso porque parece lógico que diferentes productos tengan diferentes requisitos
de transporte.
Desde principios de la década de 1950 se han propuesto varias técnicas para modelar la generación de viajes. La mayoría de los
métodos intentan predecir el número de viajes producidos (o atraídos) por hogar o zona en función de las relaciones (generalmente
lineales) que se definirán a partir de los datos disponibles. Antes de cualquier comparación de resultados entre áreas o tiempo, es
importante tener claro los siguientes aspectos mencionados anteriormente:
- qué viajes se deben considerar (p. ej., solo viajes en vehículo y viajes a pie de más de tres cuadras); cuál
- es la edad mínima que debe incluirse en el análisis (es decir, cinco años o más).
A continuación presentaremos brevemente una técnica que se puede aplicar para predecir el número futuro de viajes
por cualquiera de las categorías mencionadas anteriormente. Su ecuación básica es:
Ti=Fiti (4.1)
, Id i, Cd i)
F(PAGdi
Fi= (4.2)
F(PAG i, ICi, CC i)
C
dóndeFincluso puede ser una función multiplicativa directa sin parámetros, y los superíndicesdyC denotan el
diseño y los años actuales respectivamente.
Ejemplo 4.1Considere una zona con 250 viviendas con automóvil y 250 viviendas sin automóvil. Suponiendo que
conocemos las tasas medias de generación de viajes de cada grupo:
podemos deducir fácilmente que el número actual de viajes por día es:
Supongamos también que en el futuro todos los hogares tendrán coche; por lo tanto, asumiendo que el ingreso y la
población permanecen constantes (una hipótesis segura en ausencia de otra información), podríamos estimar un factor
de crecimiento multiplicativo simple como:
Ti=500×6 = 3000
lo que significa que el método del factor de crecimiento sobreestimaría el número total de viajes en aproximadamente un
42%. Esto es muy grave porque la generación de viajes es la primera etapa del proceso de modelado; los errores aquí se
transmiten a lo largo de todo el proceso y pueden invalidar el trabajo en etapas posteriores.
En general, los métodos de factor de crecimiento se utilizan principalmente en la práctica para predecir el número futuro de
externo viajes a un área; esto se debe a que, en primer lugar, no son demasiados (por lo que los errores no pueden ser demasiado
grandes) y también a que no existen formas sencillas de predecirlos. En algunos casos, también se utilizan, al menos como control
de sentido, para estudios de autopistas interurbanas. En las siguientes secciones discutiremos otros métodos (superiores) que
también se pueden usar en principio para modelar atracciones y producciones de viajes personales y de carga. Sin embargo, sólo
haremos referencia explícita al caso de las producciones de viajes personales, ya que es el área no solo donde hay más experiencia
práctica, sino también donde se han reportado hallazgos más interesantes.
1. Las distribuciones de probabilidadFi(Y|X) tienen la misma varianzaσ2para todos los valores deX.
2. Los mediosmi=mi(Yi) forman una línea recta conocida comolínea de regresión verdaderay dado por:
donde los parámetros de la poblaciónayb, que define la línea, debe estimarse a partir de datos de muestra.
Modelado de generación de viajes
3. Las variables aleatoriasYson estadísticamente independientes; esto significa, por ejemplo, que un gran valor
de Y1no tiende a hacerY2grande.
Lo anteriordébil conjunto de hipótesis(véase, por ejemplo, Wonnacott y Wonnacott, 1990) puede escribirse de manera
más concisa como:
Las variables aleatorias Yison estadísticamente independientes con media a+b Xiy varianza σ2.
Con estos cambios de la Figura 4.2 a la distribución que se muestra en la Figura 4.3.
A veces es conveniente describir la desviación deYide su valor esperado como el término de error o
perturbaciónmii, por lo que el modelo también puede escribirse como:
Yi=a+bXi+mii (4.4)
Tenga en cuenta que aún no estamos haciendo ninguna suposición sobre la forma de la distribución deY(ymi,
que es idéntico excepto que th
más tarde, sin embargo, con el fin de
derivar de la medición y especificación
4.2.1.2 Estimación de a y b
La figura 4.4 se puede etiquetar comográfico fundamentalde regresión lineal. Muestra la línea de regresión verdadera
(punteada)mi(Y) =a+b X, que por supuesto es desconocido para el analista, quien debe estimarlo a partir de datos
muestrales sobreYyX. También muestra coincidir con el general anterior lo mejor que puede esperar.
a=Y (4.5)
lo que asegura que la línea ajustada pase por elcentro de gravedad(X,Y)de la muestra denorteobservar-
vaciones, y
∑
XiYi
i
b=∑ (4.6)
Xi2
i
Vale la pena señalar que siXise puede escribir como una combinación lineal de la interseccióna, es decir, siXies
igual a alguna constante para todoi, la expresión (4.6) quedaría indefinida ya queXisería igual a cero para todosi,
y, por tanto, su denominador sería igual a cero.
Estos estimadores tienen las siguientes propiedades interesantes:
Figura 4.5Bondad de ajuste y diseño experimental: (a) poco confiable (Xicerrar), (b) confiable (Xiextendido)
Si se considera una cuarta hipótesis, más fuerte, que el valor esperado demicondicionado aXes cero, los estimadores de
mínimos cuadrados (4.5) y (4.6) adquieren algunas propiedades estadísticas deseables. En este caso (es decir, cuando la media demi
ponderado por la probabilidad de ocurrencia deXes cero) se dice que los estimadores de mínimos cuadrados son insesgados (es
decir, sus valores esperados son iguales a los valores verdaderosayb) y consistentes (es decir, pueden estar tan cerca como se
desee de los valores verdaderos a medida que el tamaño de la muestra llega al infinito).
Esta importante suposición puede violarse fácilmente si se omite una variable relevante del modelo y se correlaciona
con la variable observada.X. Por ejemplo, considere que la cantidad de viajes generados depende del ingreso del hogar y
la cantidad de automóviles, variables que se correlacionan positivamente ya que es más probable tener un automóvil a
medida que aumenta el ingreso. Si se omite el número de automóviles del modelo, el estimador de mínimos cuadrados
del efecto del ingreso tendrá en cuenta tanto el efecto del ingreso como el del número de automóviles y, por lo tanto,
será mayor que el verdadero coeficiente del ingreso. En la literatura existen métodos para probar y corregir la violación
de esta suposición; se remite al lector interesado a Greene (2003) para obtener más descripciones ya Guevara y Ben-Akiva
(2006) para una aplicación a elecciones discretas.
Si además de la Hipótesis 4, las hipótesis 1 y 3 se cumplen, los estimadores de mínimos cuadrados (4.5) y (4.6) no solo
son consistentes e insesgados, sino que también son los mejores (los más eficientes y los que tienen la varianza más
pequeña) entre todos posibles estimadores lineales e insesgados (AZUL). Este resultado se conoce como el teorema de
Gauss-Markov; En la literatura se pueden encontrar métodos para probar y corregir las violaciones de las hipótesis 1 y 3.
En el apartado 4.2.2 presentamos un caso práctico donde se corrige el fallo de la Hipótesis 3. Para más ejemplos y
aplicaciones, se remite nuevamente al lector interesado a Greene (2003).
Para llevar a cabo estas pruebas de hipótesis necesitamos conocer la distribución deby para ello necesitamos considerar
la hipótesis fuerte de que las variablesYse distribuyen Normal. Tenga en cuenta que, en este caso, los estimadores de
mínimos cuadrados no solo serán AZULES, sino BUE (es decir, los mejores estimadores insesgados) entre todos los
estimadores lineales y no lineales posibles. Esta suposición puede ser fuerte cuando la muestra es pequeña, pero como la
148 Transporte de modelado
el tamaño de la muestra aumenta, comenzará a mantenerse sin importar cuál sea la verdadera distribución gracias a laLey de
Números grandes.
∑
No fuebes simplemente una combinación lineal de losYi, se deduce que también se distribuyenorte(b,σ2/iX2 i).
Esto significa que podemos estandarizarlo de la forma habitual, obteniendo
b−b
z= /√ ∑ (4.7)
σ (iX2 i)
que se distribuyenorte(0,1); también es útil recordar quez2, elforma cuadrática(ver 2.5.4.1), se distribuye x2con un
grado de libertad. Sin embargo no sabemosσ2, la varianza deYcon respecto a la regresión verdadera. Un
estimador natural es usar elvarianza residual f2alrededor de la línea ajustada:
∑
(Yi−Ŷ2 i)
s2=i
norte−2
Dividimos por (norte−2) para obtener un estimador insesgado porque se han usado dos grados de
libertad para calcularaybque definenŶi(ver Wonnacott y Wonnacott 1990).
Sin embargo, si sustituimoss2porσ2en (4.7) el estandarizadobse convierte en Estudiante distribuido (ot) con (
norte−2) grados de libertad:
b−b
t= /√ ∑ (4.8)
s (iX2 i)
El denominador de (4.8) suele llamarseError estándardeby se denota porsb, por lo que podemos
escribir (4.8) como:t= (b−b)/sb.
t=b/sb (4.9)
y este valor debe compararse con el valor crítico de las estadísticas de Student para un nivel de
significación dadoαy el número apropiado de grados de libertad. Un problema es que la hipótesis
alternativa H1puede implicar unilateral (b>0) o bilaterales (bno igual 0) pruebas; esto sólo puede
determinarse examinando el fenómeno en estudio.
Ejemplo 4.2Supongamos que estamos interesados en estudiar el efecto del ingreso (I) en el número de viajes
de los hogares sin coche (T), y que podemos usar la siguiente relación:
T=a+bi
Como en teoría podemos concluir que cualquier influencia debe ser positiva (es decir, mayores ingresos siempre
significan más viajes), en este caso deberíamos probar H0contra la hipótesis alternativa unilateral H1:segundo >0. Si H0
es cierto, elt-el valor de (4.9) se compara con el valortα;d,dóndedson el número apropiado de
grados de libertad, y la hipótesis nula se rechaza sit > tα;d(ver Figura 4.6).
Por otro lado, si estuviéramos considerando incorporar una variable cuyo efecto en cualquier dirección
no fuera evidente (por ejemplo, número de trabajadoras, ya que estas pueden producir o no más viajes
que sus contrapartes masculinas), la hipótesis nula debería sea la H bilateral1:b-=0 y H0
sería rechazado si 0 no está incluido en el intervalo de confianza apropiado parab.
La prueba F para el modelo completoLa figura 4.7a muestra el conjunto de valores (a,b) para las que se aceptan
individualmente hipótesis nulas como la comentada anteriormente. Si estuviéramos interesados en probar la hipótesis
de que ambos estimadores son iguales a 0, por ejemplo, podríamos tener una región como la representada en
Modelado de generación de viajes 149
Figura 4.7Regiones de aceptación para la hipótesis nula: (a) ambos parámetros individualmente, (b) ambos parámetros juntos
Ahora bien, para realizar una prueba de dos parámetros es necesario conocer la distribución conjunta de ambos estimadores.
En este caso, como sus distribuciones marginales son Normales, la distribución conjunta también es Normal bivariada. El F
-estadístico utilizado para probar la hipótesis nula trivial H0: (a,b) = (0, 0), proporcionado como uno de los estándares en
paquetes informáticos comerciales, está dada por:
( )
∑
F=n / A2+ Xi2b2 /2s2
i
H0se acepta siFes menor o igual que el valor críticoFα(2,norte−2). Desafortunadamente, la prueba no es muy
poderosa (es decir, casi siempre se rechaza), pero se pueden construir otras similares para hipótesis nulas más
interesantes como (a,b) = (Y,0).
valorXiel error de este método podría ser alto: (Yi−Y).CuandoXise conoce, por otro lado, la mejor
predicción paraYiesŶiy esto reduce el error a solo (Yi−Ŷi), es decir, se ha explicado gran parte del
error original. De la Figura 4.8 tenemos:
Si elevamos al cuadrado las desviaciones totales y sumamos todos los valores dei, obtenemos lo siguiente:
∑ ∑ ∑
(Yi−Y)2 = (Ŷi−Y)2 + (Yi−Ŷi)2
i i i (4.10)
variación total variación explicada variación inexplicable
Ahora porque (Ŷi−Y) =b̂xies fácil ver que la variación explicada es función del coeficiente de regresión
estimadob. El proceso de descomposición de la variación total en sus partes se conoce comoAnálisis de
variaciónde la regresión, o ANOVA (tenga en cuenta que la varianza es solo la variación dividida por los
grados de libertad).
El coeficiente de determinación se define como la relación entre la variación explicada y la variación total:
(Ŷ i−Y) 2
R2= (4.11)
(Yi−Y) 2
Tiene valores límite de 1 (explicación perfecta) y 0 (ninguna explicación); los valores intermedios
pueden interpretarse como el porcentaje de la variación total explicada por la regresión. El índice está
trivialmente relacionado con la correlación de la muestra.R, que mide el grado de asociación entreXyY(ver
Wonnacott y Wonnacott 1990).
1. Multicolinealidad. Esto ocurre cuando existe una relación lineal entre las variables explicativas.
Equivalente a lo que ocurrió cuando una variable explicativa era una función lineal del intercepto en
(4.6), en este caso las ecuaciones para los regresoresbno son independientes y no se pueden resolver
de forma única.
Modelado de generación de viajes 151
2. Cuántos regresores incluir. Para tomar una decisión en este caso, se deben tener en cuenta varios factores.-a
consideración:
¿Existen fuertes razones teóricas para incluir una variable dada, o es importante para la prueba de políticas?
con el modelo?
- ¿El signo estimado del coeficiente es coherente con la teoría o la intuición y la variable es
significativa (es decir, H0rechazado en elt-¿prueba?)?
En caso de duda, una forma de avanzar es sacar la variable en cuestión y volver a estimar la regresión para examinar
el efecto de su eliminación en el resto de los coeficientes; si esto no es demasiado importante, la variable se puede
omitir paraparsimonia(el modelo es más sencillo y el resto de parámetros se pueden estimar con mayor precisión).
Los paquetes de software comerciales proporcionan un procedimiento 'automático' para abordar este problema (el
paso a pasoacercarse); sin embargo, esto puede inducir algunos problemas, como comentaremos a continuación.
Volveremos a este problema general en la sección 8.4 (Tabla 8.1) cuando analicemos los problemas de especificación
del modelo de elección discreta.
3. Coeficiente de determinación. Tiene la misma forma que (4.11). Sin embargo, en este caso la inclusión de otro
regresor siempre aumentaR2; para eliminar este problema el corregidoR2Se define como:
En este caso se intenta encontrar una relación lineal entre el número de viajes producidos o atraídos por
zona y las características socioeconómicas medias de los hogares de cada zona. Las siguientes son
algunas consideraciones interesantes:
152 Transporte de modelado
1. Los modelos zonales solo pueden explicar la variación en el comportamiento de los viajes entre zonas. Por esta razón, solo
pueden tener éxito si las variaciones interzonales reflejan adecuadamente las verdaderas razones detrás de la variabilidad de
los viajes. Para que esto suceda, sería necesario que las zonas no sólo tuvieran una composición socioeconómica homogénea,
sino que representaran una gama de condiciones lo más amplia posible. Un problema importante es que las principales
variaciones en los datos de viaje de personas ocurren a nivel intrazonal.
2. Rol del intercepto. Uno esperaría que la línea de regresión estimada pasara por el origen; sin embargo, a
menudo se han obtenido valores de intercepción grandes (es decir, en comparación con el producto del valor
promedio de cualquier variable y su coeficiente). Si esto sucede, la ecuación puede ser rechazada; si por el
contrario, el intercepto no es significativamente diferente de cero, podría ser informativo reestimar la línea,
forzándola a pasar por el origen.
3. Zonas nulas. Es posible que determinadas zonas no ofrezcan información sobre determinadas variables
dependientes (p. ej. no pueden generarse viajes de MP en zonas no residenciales). Las zonas nulas deben ser
excluidas del análisis; aunque su inclusión no debería afectar mucho a las estimaciones de los coeficientes
(porque las ecuaciones deberían pasar por el origen), un incremento arbitrario en el número de zonas que no
proporcionen datos útiles tenderá a producir estadísticos que sobrestiman la precisión de la regresión
estimada.
4. Totales zonales versus medias zonales. Al formular el modelo, el analista parece tener la opción de
utilizar variables agregadas o totales, como viajes por zona y automóviles por zona, o tasas como
viajes por hogar por zona y automóviles por hogar por zona. En el primer caso el modelo de regresión
sería:
Yi=θ0+θ1X1i+θ2X2i+. . .+θkXki+mii
yi=θ0+θ1X1i+θ2X2i+. . .+θkXki+mii
Ahora bien, como las variables agregadas reflejan directamente el tamaño de la zona, su uso debería implicar que
la magnitud del error en realidad depende del tamaño de la zona; esteheterocedasticidad(la variabilidad de la
varianza) se ha encontrado en la práctica. Usando multiplicadores, como 1/Hi, permite reducir la heteroscedasticidad
porque el modelo se hace independiente del tamaño de la zona. En esta misma línea, también se ha encontrado que
las variables agregadas tienden a tener mayor intercorrelación (es decir, multicolinealidad) que las tasas. Es
importante señalar que los modelos que utilizan variables agregadas a menudo arrojan valores más altos deR2, pero
esto es solo un efecto espurio porque el tamaño de la zona obviamente ayuda a explicar el número total de viajes (ver
Douglas y Lewis 1970). Lo que ciertamente no es correcto es la mezcla de tasas y variables agregadas en un solo
modelo.
Para finalizar este tema, es importante señalar que incluso cuando se utilizan tasas, la regresión basada en zonas está
condicionada por la naturaleza y el tamaño de las zonas (es decir, el problema de la agregación espacial). Esto se
ejemplifica claramente por el hecho de que la variabilidad interzonal disminuye con el tamaño de la zona, como se
muestra en la Tabla 4.2, construida con datos de Perth (Douglas y Lewis 1970).
Modelado de generación de viajes 153
Por estas razones, parece lógico postular modelos que sean independientes de los límites de zona. A principios de la
década de 1970 se creía que la unidad de análisis más adecuada en este caso era el hogar (y no el individuo); se
argumentó que una serie de interacciones interpersonales importantes dentro de un hogar no podrían incorporarse ni
siquiera implícitamente en un modelo individual (por ejemplo, disponibilidad de automóvil, es decir, qué miembro tiene
uso del automóvil). Esta tesis fue posteriormente cuestionada como veremos en la sección 4.3.3, pero con poco éxito
práctico.
En una aplicación basada en el hogar, cada hogar se toma como un vector de datos de entrada para incluir en el
modelo todo el rango de variabilidad observada sobre las características del hogar y su comportamiento de viaje. El
proceso de calibración, como en el caso de los modelos zonales, puede proceder paso a paso, probando cada variable
explicativa potencial hasta obtener el mejor modelo (en términos de algunas estadísticas de resumen para un nivel de
confianza dado). Se debe tener cuidado con los paquetes de computadora paso a paso automáticos porque pueden
omitir variables que son predictores ligeramente peores que otros que quedan en el modelo, pero que pueden resultar
mucho más fáciles de pronosticar.
De hecho, no se recomiendan los métodos graduales; es preferible proceder al revés,
es decir, probar un modelo con todas las variables disponibles y eliminar aquellas que no son esenciales (por motivos
teóricos o de política) y tienen poca significancia o un signo incorrecto.
Ejemplo 4.3Considere las variables viajes por hogar (Y), Numero de trabajadores (X1) y número de coches (X2). La Tabla
4.3 presenta los resultados de pasos sucesivos de la estimación de un modelo paso a paso; la última fila también muestra
(entre paréntesis) valores para elt-relación (ecuación 4.9). Suponiendo un tamaño de muestra grande, el número
apropiado de grados de libertad (norte−2) también es un número grande, por lo quet-los valores pueden compararse con
el valor crítico 1.645 para un nivel de significación del 95% en una prueba de una cola (sabemos que la hipótesis nula es
unilateral en este caso comoYdebe aumentar con ambosX1yX2).
Paso Ecuación R2
1 Y=2.36X1 0.203
2 Y=1.80X1+ 1,31X2 0.325
3 Y=0,91 + 1,44X1+ 1.07X2
(3.7) (8.2) (4.2) 0.384
154 Transporte de modelado
El tercer modelo es una ecuación razonable a pesar de su bajaR2. El intercepto 0.91 no es grande (compárelo con 1.44
veces el número de trabajadores, por ejemplo) y los coeficientes de regresión son significativamente diferentes de cero (H
0se rechaza en todos los casos). El modelo probablemente podría beneficiarse de la inclusión de más variables si
estuvieran disponibles.
Se puede obtener una indicación de qué tan buenos son estos modelos al comparar los viajes observados y
modelados para algunas agrupaciones de datos (ver Tabla 4.4). Esto es mejor que comparar totales porque en tales casos
diferentes errores pueden compensar y no se detectaría el sesgo. Como puede verse, la mayoría de las celdas muestran
una aproximación razonable (es decir, errores inferiores al 30%). Si se detectara un gran sesgo, sería necesario ajustar los
parámetros del modelo; sin embargo, esto no es fácil ya que no existen reglas claras para hacerlo y depende en gran
medida del contexto.
Nº de coches 0 1 2 3 o más
1. Transformar las variables para linealizar su efecto (ej. tomar logaritmos, elevar a una potencia). Sin embargo,
seleccionar la transformación más adecuada no es un ejercicio fácil ni arbitrario, por lo que es necesario tener
cuidado; además, si somos minuciosos, puede llevar mucho tiempo y esfuerzo.
2. Usoficticiovariables En este caso, la variable independiente considerada se divide en varios intervalos discretos
y cada uno de ellos se trata por separado en el modelo. De esta forma, no es necesario suponer que la
variable tiene un efecto lineal, porque cada una de sus partes se considera por separado en términos de su
efecto sobre el comportamiento de viaje. Por ejemplo, si la propiedad de automóviles se tratara de esta
manera, los intervalos apropiados podrían ser 0, 1 y 2 o más automóviles por hogar. Como cada hogar
muestreado solo puede pertenecer a uno de los intervalos, la variable ficticia correspondiente toma el valor 1
en esa clase y 0 en las demás. Es fácil ver que sólo (norte−1) se necesitan variables ficticias para representar
norteintervalos
Ejemplo 4.4Considere el modelo del ejemplo 4.3 y suponga que la variableX2se sustituye por los
siguientes dummies:
Z1, que toma el valor 1 para los hogares con un coche y 0 en el resto de los casos;
Z2, que toma el valor 1 para los hogares con dos o más coches y 0 en el resto de los casos.
Es fácil ver que los hogares sin automóvil corresponden al caso en que ambosZ1yZ2son 0. El
modelo del tercer paso en la Tabla 4.3 sería ahora:
Incluso sin el mejorR2valor, este modelo sería preferible al anterior solo porque el efecto
no lineal deX2(oZ1yZ2) está libre de variables ficticias, por ejemplo, 1 por hogar, el efecto sería
eficientes
claramente li wo coches
10
Al observar la Figura 4.10, surge la siguiente pregunta: ¿no sería preferible estimar regresiones separadas para los
datos de cada grupo, ya que en ese caso no requeriríamos que cada línea tuviera la misma pendiente (es decir, el
coeficiente deX1)? La respuesta es en generalNoa menos que tuviéramos una cantidad razonable de datos para cada
clase. El hecho es que el modelo con dummies usa todos los datos, mientras que cada regresión separada usaría solo una
parte de ellos, y esto es en general una desventaja. También es interesante mencionar que el uso de variables ficticias
tiende a reducir los problemas de multicolinealidad en los datos (ver Douglas y Lewis 1971).
En el caso de los modelos de regresión basados en zonas, esto no es un problema ya que el modelo se estima precisamente en
este nivel. Sin embargo, en el caso de los modelos basados en el hogar, se requiere una etapa de agregación. Sin embargo,
precisamente porque el modelo es lineal, el problema de agregación se resuelve de manera trivial reemplazando los valores
zonales promedio de cada variable independiente en la ecuación del modelo y luego multiplicándolo por el número de hogares en
cada zona. Sin embargo, debe tenerse en cuenta que la etapa de agregación puede ser un asunto muy complejo en modelos no
lineales, como veremos en el Capítulo 9.
Así, para el tercer modelo de la Tabla 4.3 tendríamos:
Ti=Hi(0.91 + 1.44X1i+1.07X2i)
Puede ser obvio para algunos lectores que los modelos anteriores no garantizan, por defecto, que el número
total de viajes que se originan (elorígenes Oi) en todas las zonas será igual al número total de viajes atraídos (el
destinos Dj) para ellos, es decir, la siguiente expresión no se cumple necesariamente:
∑ ∑
Oi= Dj (4.13)
i j
El problema es que esta ecuación es requerida implícitamente por el siguiente submodelo (es decir, la distribución de
viajes) en la estructura; no es posible tener una matriz de distribución de viajes donde el número total de viajes (T)
obtenido al sumar todas las filas es diferente al obtenido al sumar todas las columnas (ver Capítulo 5).
La solución a esta dificultad es una solución pragmática que aprovecha el hecho de que normalmente los modelos de
generación de viajes son mucho 'mejores' (en todos los sentidos de la palabra) que sus contrapartes de atracción de
viajes. Los primeros suelen ser modelos basados en el hogar bastante sofisticados con buenas variables explicativas.
Modelado de generación de viajes 157
Los modelos de atracción de viajes, por otro lado, se estiman en el mejor de los casos utilizando datos zonales. Por ello, la
práctica habitual considera que el número total de viajes resultantes de sumar todos los orígenesOies de hecho la cifra
correcta paraT; por lo tanto, todos los destinosDjse multiplican por un factorFdada por:
/∑
F=T Dj (4.14)
j
Dejartpag(h) sea el promedio de viajes con propósitopag(y en un período de tiempo determinado) realizadas por miembros de
hogares de tipoh. Los tipos se definen por la estratificación elegida; por ejemplo, una clasificación cruzada basada enmetrotamaños
de hogar ynortelas clases de propiedad de automóviles produciránMinnesotatiposh. El método estándar para calcular estas tasas
de celda es asignar los hogares en los datos de calibración a las agrupaciones de celdas individuales y totalizar, celda por celda, los
viajes observados.Tpag(h) por grupo de propósito. la tarifatpag(h) es entonces el número total de viajes en la celdah, por propósito,
dividido por el número de hogaresH(h) en eso. En forma matemática es simplemente como sigue:
El 'arte' del método radica en elegir las categorías de modo que se minimicen las desviaciones estándar de las
distribuciones de frecuencia representadas en la Figura 4.11.
El método tiene, en principio, las siguientes ventajas:
1. Los agrupamientos de clasificación cruzada son independientes del sistema de zonas del área de estudio.
2. No se requieren suposiciones previas sobre la forma de la relación (es decir, ni siquiera tienen que ser
monótonas, y mucho menos lineales).
3. Las relaciones pueden diferir en la forma de una clase a otra (por ejemplo, el efecto de los cambios en el tamaño del hogar para uno o dos
hogares propietarios de automóviles puede ser diferente).
158 transporte
Y al igual que los métodos tradicionales de clasificación cruzada, también tiene varias desventajas:
1. El modelo no permite la extrapolación más allá de sus estratos de calibración, aunque la clase más baja o más
alta de una variable puede ser abierta (por ejemplo, hogares con dos o más automóviles y cinco o más
residentes).
2. No hay medidas estadísticas de bondad de ajuste para el modelo, por lo que solo se puede determinar la cercanía
agregada a los datos de calibración, pero vea la discusión en 4.3.2.
3. Se requieren muestras excesivamente grandes; de lo contrario, la confiabilidad de los valores de las celdas variará debido a las
diferencias en el número de hogares disponibles para la calibración en cada uno. Por ejemplo, en el Estudio de Transporte/Uso
de la Tierra de Monmouthshire (ver Douglas y Lewis 1971) se encontraron los estimadores para 108 categorías (seis niveles de
ingreso, tres niveles de propiedad de automóviles y seis niveles de estructura del hogar) que se muestran en la Tabla 4.5,
usando una muestra de 4000 hogares
Nº de categorías
21 69 9 7 2
La sabiduría aceptada sugiere que se requieren al menos 50 observaciones por celda para estimar la media de manera
confiable; por lo tanto, este criterio se cumpliría en solo 18 de las 108 celdas para una muestra de 4000 hogares. Puede haber
cierto margen para usar muestreo estratificado para garantizar tamaños de muestra distribuidos de manera más uniforme en
cada categoría. Esto implica, sin embargo, costos de encuesta adicionales.
4. No existe una forma efectiva de elegir entre las variables para la clasificación, o de elegir las mejores agrupaciones de
una variable dada; la minimización de las desviaciones estándar insinuadas en la Figura 4.11 requeriría un extenso
procedimiento de 'ensayo y error' que puede considerarse inviable en estudios prácticos.
Denotemos porqel tipo de persona (es decir, con y sin coche), porai(h) el número de hogares de tipohen la zonai,
y porHq(h) el conjunto de viviendas de tipohque contiene personas de tipoq. Con esto nosotros
puede escribir las producciones de viaje con propósitopagpor tipo de personaqen la zonai,Oqp i,como sigue:
Oiqp= ∑
ai(h)tpag(h) (4.16)
h∈sede(h)
Modelado de generación de viajes 159
Para verificar cómo funciona el modelo, es posible comparar estos valores modelados con los valores observados de la
muestra de calibración. Los errores inevitables se deben al uso de promedios para las tasas.tpag(h); uno esperaría una
mejor estratificación (en el sentido de minimizar la desviación estándar en la Figura 4.11) para producir errores más
pequeños.
Hay varias formas de definir las categorías de hogares. La primera aplicación en el Reino Unido (Wootton y Pick 1967)
empleó 108 categorías de la siguiente manera: seis niveles de ingresos, tres niveles de propiedad de automóviles (0, 1 y 2
o más automóviles por hogar) y seis agrupaciones de estructuras de hogares, como en la Tabla 4.6.
1 0 1
2 0 2 o más
3 1 1 o menos
4 1 2 o más
5 2 o más 1 o menos
6 2 o más 2 o más
El problema es claramente cómo predecir el número de hogares en cada categoría en el futuro. El método más
comúnmente utilizado (ver Wilson 1974) consiste, en primer lugar, en definir y ajustar a los datos de calibración,
distribuciones de probabilidad para el ingreso (I), propiedad del carro (C) y la estructura del hogar (S); en segundo lugar,
utilizarlos para construir una función de probabilidad conjunta de pertenecer al tipo de hogarh= (I,C,S). Por lo tanto, si la
función de distribución conjunta se denota porφ(h) =φ(I,C,S), el número de hogares en la zonai perteneciente a la claseh,a
i(h), está simplemente dada por:
dóndeHies el número total de hogares en la zona. Este modelo de estimación de hogares puede probarse parcialmente
ejecutándolo con los datos del año base utilizados en la calibración. Los viajes totales estimados con la ecuación (4.16),
pero con valores simulados paraai(h), luego se puede comparar con las observaciones reales. Una desventaja adicional
del método se puede agregar en esta etapa:
(continuado)
160 Transporte de modelado
Dada esta equivalencia, desaparece la desventaja contar con medidas estadísticas de bondad de ajuste para la R2
de no modelar. Se puede utilizar, por ejemplo, el medida (4.12) para comparar diferentes potenciales
estructuras de categorías; sin embargo, se necesita un d. Para hacerR2comparables entre diferentes modelos
pequeño cambio y se restringe entre 0 y 1, no es necesario consideran un intercepto, pero en ese caso el modelo
norte
que sea identificable porque la categoría dummies sumaría uno (es decir, igual al intercepto). Como se
señalada por Guevara y Thomas (2007), esto puede ser y resuelve estableciendo una de las categorías como la base
usar dummies para todos los demás. Entonces, la m de la odel intercepto corresponde a la tasa de viaje estimada con
categoría base y los estimadores asociados cada otra variable ficticia corresponderá
a la diferencia entre la tasa de viaje del respectivo categoría activa y aquella utilizada como base. ElR2
calculado de esta manera y también laF-test pueden ser se utiliza para comparar diferentes agrupaciones de alternativas
variables para la estratificación.
Igualmente, el analista puede utilizar lat-test (4.8) como medida estadística de la confiabilidad del sider
estimaciones en cada categoría. El analista puede cotejar válido, por ejemplo, solo estratificaciones para % nivel
norte
independiente de otras variables, se pueden formar los tuun modelo lineal que depende de cada uno de los t el
niveles de las variables. Por ejemplo, si consideramos la número de viajes depende de Renta y Coche
propiedad, y que esas variables se dividen en autos), se a dos niveles (ingresos bajos y altos; 0 y 1+ ted:
norte
dóndeIBajoes igual a 1 si el hogar pertenece Otras s a la categoría de bajos ingresos y cero en caso contrario.
variables se definen de manera equivalente ymiico rresponde a un término de error.
Sin embargo, se puede señalar que este modelo notimable ya que hay un problema de multicolinealidad,
es tanIBajo+IAlto=METRO0+METRO1=1. Para lograr est es,imation el modelo necesita ser normalizado, que
utilizar algunas de las categorías como base o r mi
referencia Esto puede lograrse, por ejemplo, mediante
considerando el modelo (4.18), donde también incluimos d una intercepción para hacer elR2comparable entre
diferentes modelos:
La validez de este supuesto lineal puede ser variables probado comprobando la importancia conjunta de los
de interacción a través de unF-test, como describe el d en 4.2.1.5. En este casok=4 yr=1, porque nuestros
modelo no restringido implica la estimación de f ocoeficientes y solo uno de ellos está restringido
Modelado de generación de viajes 161
a cero en el modelo restringido (4.18). ElRSSRcorresponde al modelo (4.18) y elRSStual modelo incluyendoIBajo•
METRO1. Si la estadística es menor que el valor críticoFnk, se acepta la hipótesis nula, lo que significa que el
modelo lineal (4.18) es aceptable. Si la estadística es mayor queFnkse debe considerar el modelo con
interacciones. Vale la pena señalar que dado que en este caso el término de interacción involucra la inclusión
de solo una variable adicional, elt-estadístico (4.8) también podría usarse pero elF-La prueba es la
herramienta aplicada en general.
Otra prueba interesante, más allá del supuesto de linealidad, tiene que ver con la posibilidad de utilizar una
variable adicional para la clasificación, por ejemplo, el tamaño del hogar. En tal caso, se puede estimar el siguiente
modelo, dondeSLtomaría el valor uno si el tamaño del hogar es grande y cero en caso contrario, digamos:
Excursionesi=α+αyoIYo alto+αMETRO1METRO1i+αS3SYo+mi" i
Para saber si la inclusión del tamaño del hogar es una buena idea, unF-test se puede utilizar en general y unt-test
en el caso particular de necesitar solo una variable adicional para hacerlo; Sin embargo, el nivel de significación que
se utilizará en este último caso merece cierta atención. El procedimiento habitual es considerarlo lo más pequeño
posible, generalmente un 5%, para reducir los errores de tipo I (es decirrechazar la hipótesis nula cuando es
verdadera). Sin embargo, como excluir el tamaño del hogar puede causar endogeneidad, porque la variable puede
estar correlacionado con los ingresos o la propiedad del automóvil, el costo de excluirlo cuando debería estar allí
(error de tipo II) puede ser mayor que el costo de incluirlo si no se debe considerar (error de tipo I). Dado que existe
una compensación entre los errores de tipo I y tipo II, puede ser recomendable considerar un nivel de significación
del 10 % o incluso del 20 % en este caso.
Otra posibilidad es que el analista desee explorar la validez del umbral utilizado para definir los estratos
de ingresos altos y bajos, por ejemplo. Esto se puede lograr fácilmente ejecutando una regresión
considerando los umbrales alternativos y comparando losR2de ambos modelos. En general, el modelo con
mayorR2debe preferirse, ya que explicará una porción más grande de la varianza. Sin embargo, si
el modelo con el mayorR2da como resultado signos o tamaños de coeficientes irrazonables, o si afecta su
significado, se debe elegir la alternativa en su lugar.
Guevara y Thomas (2007) señalan que incluso después de todas las mejoras potenciales en la categoría
Análisis descrito anteriormente, elR2de este tipo de modelos suelen ser muy bajos (es decir, menos de 0,2 o
0,3). Esto no es sorprendente ya que el modelo es de hecho extremadamente simplista. La consideración de
relaciones más realistas entre las variables explicativas y el número de viajes puede lograrse mediante
regresión lineal. Los modelos descritos en la siguiente subsección representan una mejora en esa dirección.
Una combinación de clasificación cruzada y modelos de regresión de la generación de viajes puede ser el enfoque más
apropiado en ciertas ocasiones. Por ejemplo, en un área donde la distribución del ingreso es desigual, puede ser
importante medir el impacto diferencial de las políticas en diferentes grupos de ingresos; por lo tanto, puede ser
necesario modelar la demanda de viajes para cada grupo de ingresos por separado durante todo el proceso de
modelado. Supongamos ahora que en la misma área la propiedad de automóviles está aumentando rápidamente y,
como de costumbre, no está claro qué tan correlacionadas están estas dos variables; una salida útil puede ser postular
modelos de regresión basados en variables que describen el tamaño y la composición de los diferentes hogares, para
una estratificación según las dos variables anteriores.
Ejemplo 4.5La Tabla 4.7 presenta las 13 categorías de ingresos y propiedad de automóviles (Ci) definida en ESTRAUS (1989) para los
datos origen-destino del Gran Santiago 1977. Como se puede observar, el grueso de los datos corresponde a hogares sin automóvil
y de bajos ingresos. También tenga en cuenta que las categorías 7 y 10 tienen bastante
162 Transporte de modelado
pocos puntos de datos; este es, desafortunadamente, un problema general de este enfoque. Incluso las muestras más pequeñas para ingresos
muy bajos y propiedad de automóviles alta llevaron a la agregación de algunas categorías en este rango.
Las variables independientes disponibles para el análisis (es decir, después de omitir las variables estratificadoras)
incluyeron variables deletapa en el ciclo familiarvariedad, de la que hablaremos en el apartado 4.4. Sin embargo, luego de
extensas búsquedas de especificaciones, se encontró que las variables más significativas eran: número de trabajadores
(divididos en cuatro clases según los ingresos y el tipo de trabajo), número de estudiantes y número de residentes.
Los modelos de regresión lineal estimados con estas variables para cada una de las 13 categorías se consideraron
satisfactorios sobre la base de signos correctos, interceptos pequeños, niveles de significación razonables yR2(por
ejemplo, entre 0,401 para la categoría 4 y 0,682 para la categoría 7; véase Hally otros. 1987).
Finalmente, un supuesto que se puede levantar en este caso y que puede mejorar aún más el ajuste y la calidad de los
modelos, es aceptar que algunos coeficientes pueden ser los mismos en todas las categorías. Esto supondrá la
estimación conjunta de los 13 modelos y producirá necesariamente un aumento de la eficiencia, es decir, una reducción
de la varianza de los estimadores.
4.3.3.1 Introducción
Esta es una alternativa a los modelos basados en el hogar discutidos anteriormente, que fue propuesto
originalmente por Supernak (1979). Se argumentó que este enfoque ofrecía las siguientes ventajas (Supernak y
otros. 1983):
1. Un modelo de generación de viajes a nivel de persona es compatible con otros componentes del sistema de modelado de
demanda de transporte clásico, que se basa en los realizadores de viajes en lugar de en los hogares.
2. Permite un esquema de clasificación cruzada que usa todas las variables importantes y produce un número manejable
de clases; esto, a su vez, permite pronosticar más fácilmente la representación de clases.
3. El tamaño de muestra requerido para desarrollar un modelo de categoría de persona puede ser varias veces más pequeño que el
requerido para estimar un modelo de categoría de hogar.
4. Los cambios demográficos pueden explicarse más fácilmente en un modelo de categoría de persona ya que, por ejemplo, ciertas
variables demográficas clave (como la edad) son prácticamente imposibles de definir a nivel de hogar.
5. Las categorías de personas son más fáciles de pronosticar que las categorías de hogares, ya que estas últimas requieren
pronósticos sobre la formación del hogar y el tamaño de la familia; estas tareas se evitan por completo en el caso de categorías
de personas. En general el grueso de los viajes lo realizan personas mayores de 18 años; esta población es más fácil de
pronosticar con 15 a 20 años de anticipación, ya que solo se necesitan tasas de migración y supervivencia para hacerlo.
Modelado de generación de viajes 163
La mayor limitación que puede tener un modelo de categoría persona se relaciona precisamente con la principal razón por la
que se optó por modelos basados en el hogar para reemplazar los modelos basados en zonas a fines de la década de 1960; esta
es la dificultad de introducir los efectos de interacción de los hogares y los costos monetarios y los presupuestos monetarios de los
hogares en un modelo basado en la persona. Sin embargo, Supernaky otros. (1983) argumentan que no está claro cuán vitales son
estas consideraciones y cómo pueden incorporarse efectivamente incluso en un modelo basado en el hogar; de hecho, de nuestra
discusión en las secciones 4.2.3 y 4.3.1 queda claro que esto se hace solo de manera implícita.
DejartjSea la tasa de viaje, es decir, el número de viajes realizados durante un cierto período de tiempo por (el promedio)
persona en categoríaj;tjpes la tasa de viaje por propósitopag.Ties el número total de viajes realizados por los habitantes de
la zonai(todas las categorías juntas).norteies el número de habitantes de la zonai, yαJies el porcentaje de habitantes de la
zonaiperteneciente a la categoríaj. Por lo tanto existe la siguiente relación básica:
∑
Ti=nortei αJitj (4.19)
j
Al igual que en otros métodos, los viajes se dividen en con base en el hogar (HB) y sin base en el hogar (NHB), y se pueden dividir
además según el propósito (pag) que pueden aplicarse tanto a viajes HB como NHB.
El desarrollo del modelo implica las siguientes etapas:
1. Consideración de varias variables que se espera que sean importantes para explicar las diferencias en la movilidad
personal. Además, la definición de categorías de personas plausibles utilizando estas variables.
2. Análisis preliminar de las tasas de viaje para conocer qué variables tienen menor poder explicativo y
pueden ser excluidas del modelo. Esto se hace comparando las tasas de viaje de las categorías que se
diferencian únicamente por la variable analizada y probando si sus diferencias son estadísticamente
significativas.
3. Análisis detallado de las características del viaje para encontrar variables que definan categorías similares. Se excluyen
las variables que no brindan una explicación sustancial de la varianza de los datos o las variables que duplican la
explicación brindada por otras variables mejores (es decir, más fáciles de pronosticar o más sensibles a las políticas).
El ejercicio se lleva a cabo bajo la restricción de que el número de categorías finales no debe exceder un cierto
máximo práctico (por ejemplo, 15 clases).
Para este análisis se pueden utilizar las siguientes medidas: el coeficiente de correlación (Rjk), pendiente (
metrojk) e interceptar (ajk) de la regresióntjp=ajk+metrojktkp. las categoriasjykpueden ser tratados como similares si
estas medidas cumplen las siguientes condiciones (Supernaky otros. 1983):
Rjk>0.900
0.75<metrojk<1.25 (4.20)
ajk<0.10
Estas condiciones son bastante exigentes y pueden cambiar.
dóndeminorteies una medida de atracción de la zonajyCyoel costo generalizado de viajar entre zonasiy
j. Una expresión analítica típica utilizada con este fin ha sido:
∑
i=
Anorte jexp(−βCyo)
minorte
- Se formula un plan de viaje para vincular las estancias, en particular decidiendo cuáles deben ser visitadas por visitas
separadas desde el hogar (dos o más viajes) y cuáles pueden vincularse con otras estancias mediante viajes fuera del
hogar.
A partir de aquí, parece razonable tratar de modelar el número de estancias generadas por un hogar o una persona, y
dividir esas estancias entre viajes basados en el hogar y viajes no basados en el hogar. Un punto de modelado práctico
que se desprende inmediatamente de este marco es que las variables dependientes (es decir,
Modelado de generación de viajes 165
número de giras y/o viajes, o alternativamente número de estancias que se pueden alcanzar) serán números
enteros: 0, 1, 2, 3, etc. Además, la decisión entre viajar o no (es decir, entre 0 y 1) puede cabe esperar que se
tome sobre una base diferente a la decisión de realizar más de un viaje (la primera decisión es si participar en
una actividaden absoluto, y el segundo es cómo organizar el tiempo y el lugardadoque alguna participación
tendrá lugar). Otro punto es que se deben incluir los viajes en todos los modos para garantizar que se
consideren todas las actividades fuera del hogar; por lo que la exclusión de viajes cortos o viajes en modos no
motorizados restará calidad al modelo. Por lo tanto, esto es consistente con el enfoque contemporáneo para la
recopilación de datos O-D discutido en el Capítulo 3.
Las variables que se incluirán en el modelo son las mismas que en los métodos clásicos discutidos anteriormente, pero se
espera que se pueda incorporar la accesibilidad. Sin embargo, puede haber una influencia cruzada negativa entre las
accesibilidades en el hogar y fuera del hogar; por ejemplo, si los viajes desde el hogar se pueden realizar fácilmente (es decir, en un
pueblo pequeño), se necesitarán menos viajes que no sean desde el hogar.
Se deben hacer predicciones del número de estadías para cada propósito de viaje (y tenga en cuenta que las variables que
influyen en cada tipo pueden variar). Lógicamente deberíamos modelar primero los propósitos obligatorios y luego se pueden
modelar los propósitos no obligatorios, condicionados a las decisiones tomadas para los propósitos obligatorios. De manera
similar, la elección entre satisfacer una necesidad de viaje mediante un recorrido basado en el hogar o un viaje no basado en el
hogar como un desvío en un recorrido planificado previamente debe modelarse explícitamente (Algersy otros. 1995), pero los
modelos independientes son concebibles en aras de la simplicidad. Finalmente, aunque se pueden establecer modelos de
frecuencia de viajes para describir el comportamiento de hogares completos (es decir, considerando todas las interacciones que
pueden ser relevantes para el número de viajes realizados), el desarrollo de modelos basados en personas es mucho más simple
en la práctica, dada la datos que normalmente están disponibles.
1
PAG1=
1 + exp(−V)
dóndeVgeneralmente se especifica como una función lineal de parámetros desconocidosθ:
∑
V= θkXk
k
dóndeXson elementos de datos medidos, como ingresos, propiedad de automóviles y tamaño del hogar, y la
accesibilidad que debe ingresarse en una forma consistente con la teoría de maximización de la utilidad (es
decir, la teoría detrás del modelo Logit). Para esto, la forma preferida es usar un resultado de Williams (1977)
popularizado por Ben-Akiva y Lerman (1979), que establece que la forma correcta de accesibilidad es la
'logsum' del modelo de elección de destino (o modo). ; además, y como discutimos en la sección 7.4, debido a
que en este caso tenemos una estructura de Logit anidado, el parámetro que multiplica la variable de
accesibilidad logsum debe estar entre 0 y 1. Si esta condición no se cumple, las predicciones del modelo
pueden violar el sentido común ( Williams y Sénior 1977).
(continuado)
166 Transporte de modelado
El modelo Logit representa la elección de cada medio y individuo si desea o no realizar un viaje, y estos datos
es particularmente adecuado para tratar con las agregados. Pero también se pueden utilizar datos
gramo
probabilidades.PAGrepresentar proporciones que ratan lahagregados; er que probabilidades. Sin embargo, para
posibilidad de encontrar una relación significativa entre obtener la mejor accesibilidad y número de viajes, utilice
norte
los datos, ya que conserva la máxima cantidad de varia la ce desagregada. Para modelar frecuencias de viaje más
norte
0 1+
1 2+
2 3+
etc.
En cada nivel jerárquico, la elección es el número r para hacer más viajes o detenerse en el presente
(de ahí el nombre de 'modelo stop-go'). Beca entre la tuDebido a la posible gran diferencia en el comportamiento, se
opción 0/1+ y la opción choi restante usando un Cha encontrado que es preferible modelar el primero, ya que a
modelo separado. Sin embargo, debido a los múltiplesmenudo hay pocos datos sobre los viajeros que hacen
viajes, también es necesario modelar th (es decir, que mi
opciones restantes con un solo modelo 'stop-go'
predice la misma probabilidad de parar). en cada nivel de la jerarquía).
Se ha encontrado que la aplicación de este mim es sencillo. Si la probabilidad de hacer
modelo syst cualquier viaje espag(del modelo 0/1+)miprobabilidad de elegir la opción 'ir' en cada uno de
y la siguiente etapa esq(del modelo stop-go), th los números esperados de viajes es simplemente:
t=pag/ (1 -q)
El método ha sido aplicado en varios estudios en Europa (Daly 1997), obteniendo coeficientes para los diferentes
variables de accesibilidad que van desde 0,07 a 0,33 f opropósitos de viaje. Una versión más agregada sirvió en una
del modelo, utilizando regresión lineal sobre viajes obsencuesta de intercepción de la mayoría de los caminos hacia el
Modelado de generación de viajes 167
Norte de Chile, también dio buenos resultados arrojando medidas de accesibilidad (del tipo log-sum) con
coeficientes significativos del signo y magnitud propios (Iglesiaset al.2008).
Por lo general, es esclarecedor comparar los hogares en una etapa de este ciclo de vida con los hogares de la etapa
inmediatamente anterior.
Los conceptos de estilo de vida y etapa del ciclo familiar son importantes desde dos puntos de vista: primero, el de identificar
agrupaciones estables (en función de la edad o el sexo) con diferentes horarios de actividad y, en consecuencia,
168 Transporte de modelado
demandas de viaje; segundo, el de permitir el seguimiento de cambios sistemáticos que pueden estar basados en variaciones
demográficas (por ejemplo, cambios en la estructura de edad, estado civil o laboral). Numerosas tendencias demográficas de
importancia en términos de comportamiento de viaje han recibido una atención creciente desde principios de la década de 1980
(ver Spielbergy otros. 1981). Uno de los más significativos para predecir el comportamiento de los viajes es la proporción cambiante
de hogares por población, particularmente en las naciones industrializadas. Si bien la tasa de crecimiento de la población ha ido
disminuyendo constantemente desde la década de 1980, la tasa de formación de hogares ha aumentado en algunos casos. Esto se
debe, entre otras razones, al aumento del número de hogares monoparentales y del número de personas que están constituyendo
hogares individuales. Por lo tanto, las metodologías de pronóstico de viajes que asumen implícitamente proporciones estables de
hogares por población (como suele ser el caso) se verán gravemente afectadas por este cambio estructural en la composición
demográfica de la sociedad.
Otra tendencia que ha sido bien discutida es el envejecimiento general de la población, particularmente en las naciones
industrializadas. Esto es importante porque la edad tiende a asociarse con una disminución de la movilidad y un cambio en el estilo
de vida. Sin embargo, es interesante notar que las diferencias en la generación de viajes por edad pueden reflejar en parte el
llamadoefectos de cohorte. Esto significa que las personas mayores pueden viajar menos, simplemente porque siempre lo han
hecho, y no por su edad. Sin embargo, este efecto puede ser mayor para las personas mayores de 65 años y la disminución de las
tasas de generación de viajes para otros grupos de edad probablemente refleje una verdadera disminución en la propensión a
viajar.
Finalmente, otra tendencia a destacar es el aumento en la proporción de mujeres que se incorporan a la fuerza
laboral. Su importancia para la planificación y previsión del transporte se deriva de dos efectos. El primero es
simplemente el efecto de empleo directo, donde la distribución del tiempo y, en consecuencia, el comportamiento de
viaje están profundamente influenciados por los requisitos para estar realmente empleado. El segundo es más sutil y se
refiere a los cambios en los roles del hogar y sus impactos en el estilo de vida, en particular para las parejas con hijos.
Para finalizar esta sección, es interesante mencionar que las ideas discutidas anteriormente dieron lugar a una
propuesta para incorporar una variable de estructura del hogar en el modelado de generación de viajes, que se probó
con datos reales (Allaman,y otros. mil novecientos ochenta y dos). Las categorías de estructura del hogar propuestas se
basaron en la edad, el sexo, el estado civil y el apellido de cada miembro del hogar. Estas variables permitieron
determinar la presencia o ausencia de dependientes en el hogar, el número y tipo de adultos presentes y la relación entre
los miembros del hogar. Sin embargo, aunque los modelos que utilizan esta variable se pronunciaron como una mejora
considerable sobre la práctica tradicional de Allamany otros. (1982), pruebas posteriores con un conjunto de datos
diferente realizadas por McDonald y Stopher (1983) llevaron a su rechazo. Esto se basó no solo en la evidencia estadística,
sino también en la sensibilidad de las políticas (es decir, es difícil utilizar la estructura del hogar como una variable de
política) y la facilidad de los motivos de pronóstico (es decir, pronósticos a nivel de zona, particularmente para obtener
una distribución de hogares por hogar). categoría de estructura, parece ser muy problemático). McDonald y Stopher
(1983) argumentan que, en estos dos sentidos, debería preferirse una variable del tipo de vivienda y seguramente será
más fácil de usar por una agencia de planificación del gobierno local.
Los modelos de transporte, en general, se desarrollan para ayudar en la formulación y evaluación de planes y proyectos
de transporte. Aunque en muchas ocasiones se ha hecho uso de estadísticas descriptivas para examinar las tendencias de
los viajes, la mayoría de los desarrollos han utilizado datos transversales para expresar la cantidad de viajes en términos
de factores explicativos; estos factores deben ser plausibles y fáciles de pronosticar para que el modelo sea sensible a las
políticas en el año de diseño. Una suposición clave (a menudo implícita) de este enfoque es que los parámetros del
modelo permanecerán constantes (o estables) entre los años base y de diseño.
Varios estudios han examinado esta suposición en un contexto de generación de viajes, encontrando en general que
no se puede rechazar cuando los viajes por todos los modos se consideran juntos (ver Kannel y Heathington 1973; Smith
y Cleveland 1976), incluso en el caso de la zonal más bien cruda. -modelos basados (aunque
Modelado de generación de viajes 169
estos no se recomiendan de todos modos, por razones similares a las discutidas en la sección 4.2.2; ver Downes y Gyenes 1976). Sin
embargo, análisis posteriores reportaron resultados diferentes. Por ejemplo, Salóny otros. (1987) compararon las tasas de viaje
observadas y los coeficientes de regresión de los modelos ajustados a los datos de hogares recolectados para Santiago en 1977 y
1986, y los encontraron significativamente diferentes. Copley y Lowe (1981) informaron que, aunque las tasas de viaje en autobús
para ciertos tipos de categorías de hogares parecían razonablemente estables a lo largo del tiempo, las tasas de viaje en automóvil
parecían estar altamente correlacionadas con los cambios en los precios reales del combustible. Esto último tiene las siguientes
implicaciones potenciales:
1. Si existe una elasticidad distinta de cero entre las tasas de viajes en automóvil y los precios del combustible, la suposición habitual de tasas de viajes
constantes en un período de rápido aumento de los precios de la gasolina podría conducir a un grave exceso de provisión de servicios viales.
Si, por otro lado, los precios del combustible cayeran en términos reales, el supuesto de tasas constantes de viaje
conduciría a una provisión insuficiente (que es precisamente lo que se experimentó en el Reino Unido y otros países
industrializados a fines de la década de 1980).
2. Además, el equilibrio entre las inversiones futuras en instalaciones de transporte público y privado puede juzgarse
incorrectamente si se basa en el supuesto de tasas de viajes constantes a lo largo del tiempo.
Claramente entonces, la estimación correcta del efecto de los precios de los combustibles sobre las tasas de viaje (y de cualquier otro efecto
similar) longitudinalefectos) es de fundamental importancia para el análisis de políticas. Desafortunadamente, no se puede abordar con los
conjuntos de datos transversales típicamente disponibles para los estudios de transporte.
Otro factor que afecta la estabilidad de los modelos de generación de viajes a lo largo del tiempo es la evidencia
disponible sobre los cambios en el comportamiento de viaje. Cambiamos de opinión y el conjunto de actividades que nos
gustaría lograr no es fijo. Los programas de cambio de comportamiento tienen un efecto en la reducción de la cantidad
de viajes (a menudo combinándolos en recorridos más eficientes en un día diferente de la semana) y en la transferencia
de algunos de ellos a modos más amigables con el medio ambiente. Estas técnicas funcionan porque la persona se
beneficia al ahorrar el tiempo que dedica a viajar. Existe alguna evidencia de que incluso sin estas intervenciones, las
personas cambian su comportamiento de viaje en respuesta a un trabajo en el hogar más fácil y una mayor conciencia de
los problemas ambientales y de salud. La oportunidad de cambios parece ser más clara cuando se produce una
intervención importante en el sistema de transporte y actividad. Esto explicaría en parte, por ejemplo, el mayor cambio
de lo esperado hacia el transporte público cuando se introdujo por primera vez el cobro por congestión en Londres.
La estabilidad temporal a menudo es difícil de examinar porque se requieren datos (de calidad similar) para la misma
área en dos momentos diferentes. Por lo tanto, en muchas ocasiones puede ser más fácil examinar la estabilidad
geográfica (o la transferibilidad) ya que los datos de dos ubicaciones diferentes pueden estar disponibles (por ejemplo, si
dos instituciones ubicadas en diferentes áreas deciden realizar un proyecto de investigación conjunto). La transferibilidad
geográfica debe verse como un atributo importante de cualquier modelo de demanda de viajes por las siguientes
razones:
Es claro que no todas las características de viaje pueden ser transferibles entre diferentes áreas o ciudades; por
ejemplo, la duración promedio de un viaje de trabajo obviamente depende del contexto, es decir, debe ser un
170 Transporte de modelado
función del tamaño del área, la forma y la distribución de los lugares de trabajo y las zonas residenciales en el espacio. Sin
embargo, la transferibilidad de las tasas de viaje no debe verse como poco realista: los viajes reflejan las necesidades de
participación de los individuos en diversas actividades fuera del hogar y si las tasas de viaje están relacionadas con grupos
homogéneos de personas, se puede esperar que se mantengan estables y transferibles geográficamente dentro del mismo
contexto cultural.
La transferibilidad de los modelos de generación de viajes (típicamente tasas de viaje en un marco de
análisis de categoría de hogar) se ha probado relativamente raramente, produciendo resultados
normalmente insatisfactorios (ver Caldwell y Demetski 1980; Daor 1981); los pocos ejemplos exitosos han
considerado solo una parte de los viajes, por ejemplo, los viajes realizados en automóvil (ver Ashley
1978). Por otro lado, Supernak (1979, 1981) reportó la transferibilidad exitosa del modelo de generación
de viajes de categoría personal, tanto para condiciones polacas como americanas. Finalmente, Rose y
Koppelman (1984) examinaron la transferibilidad de un modelo de generación de viajes de elección
discreta, que permite el ajuste de las constantes modales utilizando datos locales. Una de sus
conclusiones fue que la similitud del contexto parecía ser un determinante importante de la
transferibilidad del modelo; también,
Supongamos que queremos estimar un modelo de generación de viajes pero carecemos de fondos para recopilar datos de
encuestas apropiados; una solución posible (pero inadecuada) es usar un modelo estimado para otra área (con suerte similar)
directamente. Sin embargo, sería muy deseable modificarlo para reflejar las condiciones locales con mayor precisión.
Esto se puede hacer mediante técnicas bayesianas para actualizar los parámetros del modelo original utilizando
información de una pequeña muestra en el contexto de la aplicación. La actualización bayesiana considera unprevio
distribución (es decir, la de los parámetros originales a actualizar), nueva información (es decir, a obtener de la
pequeña muestra) y unaposteriordistribución correspondiente a los parámetros del modelo actualizado para el
nuevo contexto. Las técnicas de actualización son muy importantes en un marco de planificación continua; veremos
este tema aparecer en varias partes de este libro.
Considere, por ejemplo, el problema de actualizar las tasas de viaje por categorías de hogar; Siguiendo a
Mahmassani y Sinha (1981), emplearemos la notación de la tabla 4.8.
La tasa media de viajes de una categoría (o celda) es, por supuesto, el promedio de una muestra de tasas de viajes de los hogares. De
acuerdo con laTeorema del límite central, si el número de observaciones en una celda es al menos 30, la distribución muestral de las tasas
de viajes (medias) de la celda puede considerarse distribuida como Normal, independientemente de la distribución de las tasas de viajes
de los hogares. Por lo tanto, la distribución previa de las tasas de disparo de la celda
para el modelo original es N(t1,S2 1/norte1), porquet1yS2 1/norte1son estimadores insesgados de su media y
diferencia. De manera similar, las celdas para la muestra pequeña (nueva información) pueden considerarse distribuidas
Normal con parámetrostsyS2 s/nortes.
El teorema de Bayes establece que si las distribuciones anterior y muestral son normales con varianzas conocidas
σ2, entonces la distribución posterior (actualizada) de las tasas medias de viaje también es Normal con el
Modelado de generación de viajes 171
siguientes parámetros:
1/ σ21 1/ σ2s
t2= t
2 1
+ t (4.21)
1/ σ12+1/ σs 1/ σ12+1/ σ2 segundos
s
1
σ22= (4.22)
1/ σ12+1/ σ2 s
que, sustituyendo por los valores conocidosS2ynorte, producir:
1ts
norte1S2 t1+nortesS2
s
t2= (4.23)
Ss2+norte
norte1 sS21
S2 2
1Ss
σ22= (4.24)
Ss2+nortesS21
norte1
Es importante recalcar que esta se distribuye a los on no es el de las tasas de viaje individuales de cada una
hogares en la celda correspondiente, pero se de las medias de las tasas de viaje de la celda. De hecho, la
desconoce la de distribución de las tasas individuales; única
t información que tenemos es que comparten el
misma media (posterior)t2.
Ejemplo 4.6La tasa media de viajes, su varianza a norted el número de observaciones para hace dos hogares se
categorías, obtenida en un estudio realizado 10 años muestra a continuación:
Categorías de hogar
Se cree que estos valores podrían estar ligeramente fuera de los fondos f fecha para uso directo hoy, pero no hay suficientes
para embarcarse en una encuesta a gran escala. Los valores pequeños se smuestras tratadas finalmente se toma, lo que produce el
muestran a continuación:
Categorías de hogar
El lector puede verificar eso aplicando la ecuación s (4.23) y (4.24) es posible estimar la
siguiendo los valores y varianzas de la tasa de viaje:
(continuado)
172 Transporte de modelado
Categorías de hogar
Posterior 1 2
Tasa de viajes (viajes/día) 8.68 5.04
Diferencia 0.82 0.05
Ejercicios
4.1 Considere una zona con las siguientes características:
Debido a una disminución en los aranceles de importación y un aumento del ingreso real del 30%, se espera que en
cinco años el 50% de los hogares sin automóvil adquiera uno. Estime cuántos viajes generaría la zona en ese caso;
compruebe si su método es verdaderamente el mejor disponible.
4.2 Considere los siguientes modelos de atracción de viajes estimados usando un paquete de computación estándar (t-las
proporciones se dan entre paréntesis);
(c) Si una zona tiene 1000 hogares (con un promedio de dos trabajadores por hogar), de los cuales el 50% no tiene
automóvil, el 35% tiene un solo automóvil y el resto exactamente dos automóviles, estime el número total de
viajes generados por la zona,Oi, con ambos modelos. Discuta sus resultados.
4.4 La siguiente tabla presenta los datos recolectados en la última encuesta de hogares O–D (realizada hace diez años)
para tres zonas en particular:
Hace diez años se estimaron dos modelos de generación de viajes basados en el hogar utilizando estos datos. El primero
fue un modelo de regresión lineal dado por:
El segundo fue un modelo de análisis de categorías basado en dos estratos de ingresos (ingresos bajos y altos) y
dos niveles de estructura familiar (1 o menos y 2 o más trabajadores por hogar). Las tarifas de viaje estimadas se
dan en la siguiente tabla:
Ingreso
Si el total de viajes generados hoy en hora punta por las tres zonas viene dado por:
I 8 200
Yo 24 300
tercero 92 500
y se estima que las características de la zona (ingresos, número de hogares y estructura familiar) se han
mantenido estables, decidir cuál es el mejor modelo. Explica tu respuesta.