ModellingTransport-161-195 en Es

Traducido del inglés al español - www.onlinedoctranslator.
com
4
Modelado de generación de viajes
Como vimos en el Capítulo 1, la etapa de generación de viajes del modelo de transporte clásico tiene como objetivo
predecir el número total de viajes generados por (Oi) y atraído por (Dj) cada zona del área de estudio. Esto se puede
conseguir de varias formas: empezando por los viajes de las personas u hogares que residen en cada zona o
directamente con algunas de las propiedades de las zonas: población, empleo, número de coches, etc. También se ha
tratado el tema visto como unfrecuencia de viajeproblema de elección: ¿cuántos viajes de compras (u otros fines)
realizará este tipo de persona durante una semana representativa? Esto generalmente se lleva a cabo utilizando modelos
de elección discreta, como se analiza en los capítulos 7 a 9, y luego se expresa en términos como: ¿cuál es la probabilidad
de que este tipo de persona realice cero, uno, dos o más viajes con este propósito por semana?
En este capítulo nos concentramos en el primer enfoque (es decir, predecir los totalesOiyDja partir de datos sobre los
atributos socioeconómicos de los hogares), y también dan una idea sobre el segundo que tiene ventajas en algunos
estudios.
Comenzaremos definiendo algunos conceptos básicos y procederemos a examinar algunos de los factores que inciden
en la generación y atracción de viajes. Luego revisaremos los principales enfoques de modelado, comenzando con la
técnica más simple del factor de crecimiento. Antes de embarcarnos en enfoques más sofisticados, presentaremos una
revisión razonable del modelo de regresión lineal, que complementa bien los temas estadísticos anteriores presentados
en los Capítulos 2 y 3.
A continuación, consideraremos los modelos de generación de viajes de regresión lineal basados en zonas y
hogares, dando cierto énfasis al problema de las no linealidades que a menudo surgen en este caso. También
abordaremos por primera vez el problema de la agregación (por ejemplo, la obtención de totales zonales), que
aquí tiene una solución trivial precisamente por la forma lineal del modelo. Luego pasaremos a los modelos de
clasificación cruzada, donde examinaremos no solo la especificación de análisis de categoría clásica, sino
también enfoques más modernos, incluido el modelo de análisis de categoría de persona. Luego examinamos la
relación entre la generación de viajes y la accesibilidad, incluida una breve discusión sobre los modelos de
frecuencia de viajes. El capítulo termina con dos secciones cortas: la primera discute el problema de predecir
valores futuros para las variables explicativas en los modelos,
4.1 Introducción
4.1.1 Algunas definiciones básicas
Como siempre, las definiciones juegan un papel importante en nuestra comprensión de cualquier fenómeno. Viajar no es diferente.
La pregunta es, ¿cuál es el evento básico de interés para nuestros modelos, actividades que involucran un corto
Transporte de modelado, Cuarta edición. Juan de Dios Ortúzar y Luis G. Willumsen. ©

2011 John Wiley & Sons, Ltd. Publicado en 2011 por John Wiley & Sons, Ltd.
140 Transporte de modelado
período de estancia en un lugar (estancia), el desplazamiento de un lugar a otro (viaje o jornada), o una secuencia de tales
viajes y estancias que empiezan y terminan en casa y constituyen una salida o un recorrido? ¿Qué pasa con los tours que
no se basan en casa? El modelador debe tener en cuenta todas estas opciones al decidirse por un conjunto de la siguiente
lista para desarrollar y aplicar un conjunto de modelos.
viaje o viajeEste es un movimiento de un solo sentido desde un punto de origen hasta un punto de destino. Normalmente nos
interesan todos los viajes vehiculares. Los recorridos a pie inferiores a un cierto umbral definido por el estudio (por ejemplo, 300
metros o tres cuadras) a menudo se han ignorado, así como los recorridos realizados por bebés menores de cinco años. Sin
embargo, este énfasis está cambiando con una mayor atención que se presta a los viajes no motorizados y, como se discutió en el
capítulo anterior, debido a los requisitos del marco de actividad de retiro recomendado para las encuestas de movilidad.
Viaje basado en el hogar (HB)Este es uno donde el hogar del viajero es el origen o el destino del viaje. Tenga en
cuenta que para los visitantes de otra ciudad, su hotel actúa como un hogar temporal en la mayoría de los
estudios.
Viaje no basado en el hogar (NHB)Este, por el contrario, es aquel en el que ninguno de los extremos del viaje es el hogar
del viajero.
Producción de viajesEsto se define como ip

(ver Figura 4.1).
Figura 4.1Viajes producciones y atracciones
Viaje Atracción Esto se define como el final fuera del hogar de un viaje HB o el destino de un viaje NHB
(ver Figura 4.1).
Generación de viajes Esto a menudo se define como el número total de viajes generados por los hogares en una zona,
ya sean HB o NHB. Esto es lo que producirían la mayoría de los modelos y queda entonces la tarea de asignar viajes NHB
a otras zonas como producciones de viaje.
MorarUn breve período de estancia en un lugar determinado. Suele tener un propósito asociado a esta estancia:
trabajo, estudio, compras, ocio, etc.
ActividadUn esfuerzo o interés a menudo asociado con un propósito como el anterior pero no necesariamente
vinculado a una ubicación fija. Se podía optar por ir de compras o al cine en diferentes lugares.
Tour o cadena de viajeUn conjunto de estancias y viajes vinculados. Los últimos tres conceptos se corresponden mejor con la idea de viajar
como demanda derivada (es decir, depende en gran medida de la demanda de otras actividades), pero inicialmente fueron utilizados
principalmente por modeladores de elección discreta en la práctica (ver Dalyy otros. 1983). Los modelos contemporáneos, en particular los del
tipo de frecuencia de viaje, suelen estar más interesados en los recorridos.
Modelado de generación de viajes 141
4.1.2 Caracterización de los viajes

4.1.2.1 Por Propósito
Se ha encontrado en la práctica que se puede obtener una mejor comprensión de los modelos de viajes y generación de
viajes si los viajes por diferentes propósitos se identifican y modelan por separado. En el caso de los viajes en MP, se han
empleado una serie de categorías:
- Viajar para trabajar;

- viajes a la escuela o la universidad (viajes educativos);
- viajes de compras;
- viajes sociales y recreativos;
- viajes de escolta (para acompañar o recoger a otra persona);
- otros viajes.
Los dos primeros suelen denominarse viajes obligatorios (u obligatorios) y todos los demás se denominan viajes
discrecionales (u opcionales). La última categoría engloba todos los viajes realizados con fines menos rutinarios, como
salud y negocios personales (necesidad de obtener un pasaporte o un certificado). Tenga en cuenta que los contextos
sociales y culturales pueden cambiar la importancia de los diferentes tipos de viajes y, por lo tanto, la clasificación más
adecuada. Los viajes de NHB a veces se separan en "por negocios" y "otros", pero a menudo se mantienen como una sola
categoría porque solo representan el 15-20% de todos los viajes totales.
4.1.2.2 Por hora del día

Los viajes a veces se clasifican en viajes de temporada alta y de temporada baja; la proporción de viajes por
diferentes propósitos suele variar mucho con la hora del día. Este tipo de clasificación, aunque importante, se
complica cuando interesan recorridos más que viajes, ya que un recorrido completo puede comprender viajes
realizados en varios momentos del día.
La Tabla 4.1 resume los datos de la Encuesta Origen Destino Gran Santiago 1977 (DICTUC, 1978) como un ejemplo de
buenos y malos rasgos; el período pico de la mañana (AM) (a veces se supone que el período pico de la tarde es su
imagen especular) ocurrió entre las 7:00 y las 9:00 y el período de menor actividad representativo se tomó entre las 10:00
y las 12:00. Algunos comentarios están en orden con respecto a esta tabla. En primer lugar, tenga en cuenta que aunque
la gran mayoría (87,18%) de los viajes en el pico de la mañana son obligatorios (es decir, ya sea para trabajar o para
estudiar), este no es el caso en el período de menor actividad. En segundo lugar, de los datos surge un rasgo típico de un
país en vías de desarrollo: la gran proporción de viajes por motivos burocráticos en ambos
Tabla 4.1 Ejemplo de clasificación de viaje
pico de la mañana Fuera de pico
Objetivo No. % No. %
Trabajar 465 683 52.12 39 787 12.68

Educación 313 275 35.06 15 567 4.96
Compras 13 738 1.54 35 611 11.35
Social 7 064 0.79 16 938 5.40
Salud 14 354 1.60 8 596 2.74
Burocracia 34 735 3.89 57 592 18.35
Acompañamiento 18 702 2.09 6 716 2.14
Otro 1 736 0.19 2 262 0.73
Vuelve a casa 24 392 2.72 130 689 41.65
períodos. En tercer lugar, también se revela claramente un problema causado por una clasificación defectuosa, o falta de
previsión en la etapa de codificación de datos: lavuelve a casalos viajes (que suponen el 41,65% del total de viajes fuera de
horas punta) son obviamente viajes con otra finalidad; el hecho de que regresaran a casa no es tan importante como el
motivo por el que se fueron de casa en primer lugar. De hecho, estos datos necesitaban recodificarse para obtener
información adecuada para el modelado de generación de viajes (ver Hally otros. 1987). Este tipo de problemas solía
ocurrir antes de que los conceptos de producción de viajes y atracciones reemplazaran conceptos como orígenes y
destinos, que no abordaban explícitamente la capacidad de generación de actividades en el hogar y fuera del hogar.
4.1.2.3 Por tipo de persona
Esta es otra clasificación importante, ya que el comportamiento de viaje individual depende en gran medida de los
atributos socioeconómicos. Generalmente se emplean las siguientes categorías:
- nivel de ingresos (por ejemplo, tres estratos: ingresos bajos, medios y altos);
- propiedad de automóviles (típicamente tres estratos: 0, 1 y 2 o más automóviles);
- tamaño y estructura del hogar (por ejemplo, seis estratos en los estudios británicos clásicos).
Es importante tener en cuenta que el número total de estratos puede aumentar muy rápidamente (por ejemplo, 54 en
el ejemplo anterior) y esto puede tener fuertes implicaciones en términos de requisitos de datos, calibración y uso del
modelo. Por esta razón, generalmente se requieren compensaciones, ajustes y agregaciones (ver la discusión en Daly y
Ortúzar 1990).
4.1.3 Factores que afectan la generación de viajes
En el modelado de generación de viajes, normalmente nos interesan no solo los viajes de personas, sino también los viajes de
carga. Por esta razón, generalmente se han requerido modelos para cuatro grupos principales (es decir, personal y carga,
producciones de viajes y atracciones). En lo que sigue consideraremos brevemente algunos factores que han resultado importantes
en los estudios prácticos. Sin embargo, no discutiremos el modelado de generación de viajes de carga (aunque se había hecho un
poco a finales de siglo), sino que pospondremos una discusión sobre el tema general del modelado de demanda de carga hasta el
Capítulo 13.
4.1.3.1 Producciones de viajes personales
Se han propuesto los siguientes factores para su consideración en muchos estudios prácticos:
- ingreso;
- propiedad del carro;
-
- estructura del hogar;
tamaño de la familia;
- valor de la tierra;
- densidad residencial;
- accesibilidad.
Los primeros cuatro (ingresos, propiedad de automóviles, estructura del hogar y tamaño de la familia) se han considerado en
varios estudios de generación de viajes en el hogar, mientras que el valor de la tierra y la densidad residencial son típicos de los
estudios zonales. El último, la accesibilidad, rara vez se ha utilizado aunque muchos estudios han intentado incluirlo. La razón es
que ofrece una forma de hacer que la generación de viajes sea elástica (sensible) a los cambios en el sistema de transporte;
Volveremos sobre este tema en la sección 4.3.
4.1.3.2 Atracciones personales del viaje
El factor más utilizado ha sido el espacio techado disponible para servicios industriales, comerciales y otros. Otro
factor utilizado ha sido el empleo zonal, y algunos estudios han intentado incorporar una medida de
accesibilidad. Sin embargo, es importante señalar que en este caso no se han reportado muchos avances.
4.1.3.3 Producciones y atracciones de viajes de carga
Estos normalmente representan pocos viajes vehiculares; de hecho, como mucho representan el 20% de todos los viajes
en ciertas áreas de los países industrializados, aunque aún pueden ser significativos en términos de su contribución a la
congestión. Las variables importantes incluyen:
- Número de empleados;
- número de ventas;
- área techada de firme;
- superficie total de la empresa.
Hasta donde sabemos, ni la accesibilidad ni los tipos de empresa se han considerado nunca como variables
explicativas; esto último es curioso porque parece lógico que diferentes productos tengan diferentes requisitos
de transporte.
4.1.4 Modelado de factores de crecimiento
Desde principios de la década de 1950 se han propuesto varias técnicas para modelar la generación de viajes. La mayoría de los
métodos intentan predecir el número de viajes producidos (o atraídos) por hogar o zona en función de las relaciones (generalmente
lineales) que se definirán a partir de los datos disponibles. Antes de cualquier comparación de resultados entre áreas o tiempo, es
importante tener claro los siguientes aspectos mencionados anteriormente:
- qué viajes se deben considerar (p. ej., solo viajes en vehículo y viajes a pie de más de tres cuadras); cuál
- es la edad mínima que debe incluirse en el análisis (es decir, cinco años o más).
A continuación presentaremos brevemente una técnica que se puede aplicar para predecir el número futuro de viajes
por cualquiera de las categorías mencionadas anteriormente. Su ecuación básica es:
Ti=Fiti (4.1)
dóndeTiytison respectivamente viajes futuros y actuales en la zonai, yFies un factor de crecimiento.

El único problema del método es la estimación deFi, el resto es trivial. Normalmente el factor está relacionado con
variables como la población (PAG), ingreso (I) y propiedad de automóviles (C), en una función como:
, Id i, Cd i)
F(PAGdi
Fi= (4.2)
F(PAG i, ICi, CC i)
C
dóndeFincluso puede ser una función multiplicativa directa sin parámetros, y los superíndicesdyC denotan el
diseño y los años actuales respectivamente.
Ejemplo 4.1Considere una zona con 250 viviendas con automóvil y 250 viviendas sin automóvil. Suponiendo que
conocemos las tasas medias de generación de viajes de cada grupo:
Hogares con coche producen: Hogares sin coche

6,0 viajes/día
producen: 2,5 viajes/día
podemos deducir fácilmente que el número actual de viajes por día es:
ti=250×2.5 + 250×6.0 = 2125 viajes/día
Supongamos también que en el futuro todos los hogares tendrán coche; por lo tanto, asumiendo que el ingreso y la
población permanecen constantes (una hipótesis segura en ausencia de otra información), podríamos estimar un factor
de crecimiento multiplicativo simple como:
Fi=Cd i/CC i=1/0.5 = 2

y aplicando la ecuación (4.1) podríamos estimar el número de viajes futuros como:
Ti=2×2125 = 4250 viajes/día

Sin embargo, el método es obviamente muy tosco. Si usamos nuestra información sobre las tasas de viaje promedio y
asumimos que se mantendrán constantes (que en realidad es la suposición principal detrás de uno de los métodos de
pronóstico más populares, como veremos a continuación), podríamos estimar el número futuro de viajes como :
Ti=500×6 = 3000
lo que significa que el método del factor de crecimiento sobreestimaría el número total de viajes en aproximadamente un
42%. Esto es muy grave porque la generación de viajes es la primera etapa del proceso de modelado; los errores aquí se
transmiten a lo largo de todo el proceso y pueden invalidar el trabajo en etapas posteriores.
En general, los métodos de factor de crecimiento se utilizan principalmente en la práctica para predecir el número futuro de
externo viajes a un área; esto se debe a que, en primer lugar, no son demasiados (por lo que los errores no pueden ser demasiado
grandes) y también a que no existen formas sencillas de predecirlos. En algunos casos, también se utilizan, al menos como control
de sentido, para estudios de autopistas interurbanas. En las siguientes secciones discutiremos otros métodos (superiores) que
también se pueden usar en principio para modelar atracciones y producciones de viajes personales y de carga. Sin embargo, sólo
haremos referencia explícita al caso de las producciones de viajes personales, ya que es el área no solo donde hay más experiencia
práctica, sino también donde se han reportado hallazgos más interesantes.
4.2 Análisis de regresión

La siguiente subsección proporciona una breve introducción a la regresión lineal. El lector familiarizado con este tema
puede pasar directamente a la subsección 4.2.2.
4.2.1 El modelo de regresión lineal

4.2.1.1 Introducción
Considere un experimento que consiste en observar los valores que una determinada variableY={Yi}toma para
diferentes valores de otra variableX. Si el experimento no es determinista observaríamos diferentes valores deYi
por el mismo valor deXi.
llamemosFi(Y|X) la distribución de probabilidad deYipor un valor dadoXi; por lo tanto, en general podríamos tener una
función diferenteFipor cada valor deXcomo se muestra en la Figura 4.2.
Sin embargo, un caso tan completamente general es intratable; para hacerlo más manejable se requieren ciertas
hipótesis sobre las regularidades de la población. Supongamos que:
1. Las distribuciones de probabilidadFi(Y|X) tienen la misma varianzaσ2para todos los valores deX.
2. Los mediosmi=mi(Yi) forman una línea recta conocida comolínea de regresión verdaderay dado por:
mi(Yi) =a+bXi (4.3)
donde los parámetros de la poblaciónayb, que define la línea, debe estimarse a partir de datos de muestra.
Modelado de generación de viajes
Figura 4.2Distribuciones generales deYdadoX
3. Las variables aleatoriasYson estadísticamente independientes; esto significa, por ejemplo, que un gran valor
de Y1no tiende a hacerY2grande.
Lo anteriordébil conjunto de hipótesis(véase, por ejemplo, Wonnacott y Wonnacott, 1990) puede escribirse de manera
más concisa como:
Las variables aleatorias Yison estadísticamente independientes con media a+b Xiy varianza σ2.
Con estos cambios de la Figura 4.2 a la distribución que se muestra en la Figura 4.3.
A veces es conveniente describir la desviación deYide su valor esperado como el término de error o
perturbaciónmii, por lo que el modelo también puede escribirse como:
Yi=a+bXi+mii (4.4)
Tenga en cuenta que aún no estamos haciendo ninguna suposición sobre la forma de la distribución deY(ymi,
que es idéntico excepto que th
más tarde, sin embargo, con el fin de
derivar de la medición y especificación
Figura 4.3Distribución deYasumido en regresión lineal

4.2.1.2 Estimación de a y b
La figura 4.4 se puede etiquetar comográfico fundamentalde regresión lineal. Muestra la línea de regresión verdadera
(punteada)mi(Y) =a+b X, que por supuesto es desconocido para el analista, quien debe estimarlo a partir de datos
muestrales sobreYyX. También muestra coincidir con el general anterior lo mejor que puede esperar.
Figura 4.4Líneas de regresión verdaderas y estimadas
Es importante distinguir entre los erroresmii, que no se conocen y pertenecen a la verdadera

recta de regresión y las diferenciasεi, entre observado (Yi) y valores ajustados (Ŷi). mínimos cuadrados
√
estimación, que es el método de ajuste de línea más atractivo, resulta de la minimización deεi.
Si hacemos el siguiente cambio de variableXi=Xi−X, dóndeXes la media deX, es fácil demostrar que las líneas
de regresión anteriores mantienen sus pendientes (bybrespectivamente) pero obviamente cambian sus
intersecciones (ayarespectivamente) yo∑ n los nuevos ejes (y, x). El cambio es conveniente porque el nuevo
variableXtiene la siguiente propiedad: iXi=0.
Bajo esta transformación, los estimadores de mínimos cuadrados están dados por:
a=Y (4.5)
lo que asegura que la línea ajustada pase por elcentro de gravedad(X,Y)de la muestra denorteobservar-
vaciones, y
∑
XiYi
i
b=∑ (4.6)
Xi2
i
Vale la pena señalar que siXise puede escribir como una combinación lineal de la interseccióna, es decir, siXies
igual a alguna constante para todoi, la expresión (4.6) quedaría indefinida ya queXisería igual a cero para todosi,
y, por tanto, su denominador sería igual a cero.
Estos estimadores tienen las siguientes propiedades interesantes:
mi(a) =a Var(a) =σ2/norte

/∑
mi(b) =b Var(b) =σ2 Xi2
i
De paso, la fórmula de la varianza debtiene implicaciones interesantes en términos de diseño experimental.

Primero, se puede notar que la varianza de ambos estimadores disminuye con el tamaño de la muestranorte.
Además, si los valoresXestán demasiado cerca, como en la figura 4.5a, sus desviaciones de la mediaXserá
pequeño y por lo tanto la suma deXiserá pequeño; por esta razón la varianza debserá grande y asíbserá un
estimador poco fiable. En el caso contrario, representado en la figura 4.5b, aunque los erroresεson del mismo
tamaño que antes,bvoluntad de los estimadores al aumentar t que están más alejados del me
Figura 4.5Bondad de ajuste y diseño experimental: (a) poco confiable (Xicerrar), (b) confiable (Xiextendido)
Si se considera una cuarta hipótesis, más fuerte, que el valor esperado demicondicionado aXes cero, los estimadores de
mínimos cuadrados (4.5) y (4.6) adquieren algunas propiedades estadísticas deseables. En este caso (es decir, cuando la media demi
ponderado por la probabilidad de ocurrencia deXes cero) se dice que los estimadores de mínimos cuadrados son insesgados (es
decir, sus valores esperados son iguales a los valores verdaderosayb) y consistentes (es decir, pueden estar tan cerca como se
desee de los valores verdaderos a medida que el tamaño de la muestra llega al infinito).
Esta importante suposición puede violarse fácilmente si se omite una variable relevante del modelo y se correlaciona
con la variable observada.X. Por ejemplo, considere que la cantidad de viajes generados depende del ingreso del hogar y
la cantidad de automóviles, variables que se correlacionan positivamente ya que es más probable tener un automóvil a
medida que aumenta el ingreso. Si se omite el número de automóviles del modelo, el estimador de mínimos cuadrados
del efecto del ingreso tendrá en cuenta tanto el efecto del ingreso como el del número de automóviles y, por lo tanto,
será mayor que el verdadero coeficiente del ingreso. En la literatura existen métodos para probar y corregir la violación
de esta suposición; se remite al lector interesado a Greene (2003) para obtener más descripciones ya Guevara y Ben-Akiva
(2006) para una aplicación a elecciones discretas.
Si además de la Hipótesis 4, las hipótesis 1 y 3 se cumplen, los estimadores de mínimos cuadrados (4.5) y (4.6) no solo
son consistentes e insesgados, sino que también son los mejores (los más eficientes y los que tienen la varianza más
pequeña) entre todos posibles estimadores lineales e insesgados (AZUL). Este resultado se conoce como el teorema de
Gauss-Markov; En la literatura se pueden encontrar métodos para probar y corregir las violaciones de las hipótesis 1 y 3.
En el apartado 4.2.2 presentamos un caso práctico donde se corrige el fallo de la Hipótesis 3. Para más ejemplos y
aplicaciones, se remite nuevamente al lector interesado a Greene (2003).
4.2.1.3 Pruebas de hipótesis para b̂
Para llevar a cabo estas pruebas de hipótesis necesitamos conocer la distribución deby para ello necesitamos considerar
la hipótesis fuerte de que las variablesYse distribuyen Normal. Tenga en cuenta que, en este caso, los estimadores de
mínimos cuadrados no solo serán AZULES, sino BUE (es decir, los mejores estimadores insesgados) entre todos los
estimadores lineales y no lineales posibles. Esta suposición puede ser fuerte cuando la muestra es pequeña, pero como la
el tamaño de la muestra aumenta, comenzará a mantenerse sin importar cuál sea la verdadera distribución gracias a laLey de
Números grandes.
∑
No fuebes simplemente una combinación lineal de losYi, se deduce que también se distribuyenorte(b,σ2/iX2 i).
Esto significa que podemos estandarizarlo de la forma habitual, obteniendo
b−b
z= /√ ∑ (4.7)
σ (iX2 i)
que se distribuyenorte(0,1); también es útil recordar quez2, elforma cuadrática(ver 2.5.4.1), se distribuye x2con un
grado de libertad. Sin embargo no sabemosσ2, la varianza deYcon respecto a la regresión verdadera. Un
estimador natural es usar elvarianza residual f2alrededor de la línea ajustada:
∑
(Yi−Ŷ2 i)
s2=i
norte−2
Dividimos por (norte−2) para obtener un estimador insesgado porque se han usado dos grados de
libertad para calcularaybque definenŶi(ver Wonnacott y Wonnacott 1990).
Sin embargo, si sustituimoss2porσ2en (4.7) el estandarizadobse convierte en Estudiante distribuido (ot) con (
norte−2) grados de libertad:
b−b
t= /√ ∑ (4.8)
s (iX2 i)
El denominador de (4.8) suele llamarseError estándardeby se denota porsb, por lo que podemos
escribir (4.8) como:t= (b−b)/sb.
Elt-pruebaUna hipótesis nula típica es H0:b=0; en este caso (4.8) se reduce a:
t=b/sb (4.9)
y este valor debe compararse con el valor crítico de las estadísticas de Student para un nivel de
significación dadoαy el número apropiado de grados de libertad. Un problema es que la hipótesis
alternativa H1puede implicar unilateral (b>0) o bilaterales (bno igual 0) pruebas; esto sólo puede
determinarse examinando el fenómeno en estudio.
Ejemplo 4.2Supongamos que estamos interesados en estudiar el efecto del ingreso (I) en el número de viajes
de los hogares sin coche (T), y que podemos usar la siguiente relación:
T=a+bi
Como en teoría podemos concluir que cualquier influencia debe ser positiva (es decir, mayores ingresos siempre
significan más viajes), en este caso deberíamos probar H0contra la hipótesis alternativa unilateral H1:segundo >0. Si H0
es cierto, elt-el valor de (4.9) se compara con el valortα;d,dóndedson el número apropiado de
grados de libertad, y la hipótesis nula se rechaza sit > tα;d(ver Figura 4.6).
Por otro lado, si estuviéramos considerando incorporar una variable cuyo efecto en cualquier dirección
no fuera evidente (por ejemplo, número de trabajadoras, ya que estas pueden producir o no más viajes
que sus contrapartes masculinas), la hipótesis nula debería sea la H bilateral1:b-=0 y H0
sería rechazado si 0 no está incluido en el intervalo de confianza apropiado parab.
La prueba F para el modelo completoLa figura 4.7a muestra el conjunto de valores (a,b) para las que se aceptan
individualmente hipótesis nulas como la comentada anteriormente. Si estuviéramos interesados en probar la hipótesis
de que ambos estimadores son iguales a 0, por ejemplo, podríamos tener una región como la representada en
Figura 4.6Región de rechazo paraα= 5%
Figura 4.7b; es decir, aceptando que cada p t

ambos deben ser 0 juntos.
Figura 4.7Regiones de aceptación para la hipótesis nula: (a) ambos parámetros individualmente, (b) ambos parámetros juntos
Ahora bien, para realizar una prueba de dos parámetros es necesario conocer la distribución conjunta de ambos estimadores.
En este caso, como sus distribuciones marginales son Normales, la distribución conjunta también es Normal bivariada. El F
-estadístico utilizado para probar la hipótesis nula trivial H0: (a,b) = (0, 0), proporcionado como uno de los estándares en
paquetes informáticos comerciales, está dada por:
( )
∑
F=n / A2+ Xi2b2 /2s2
i
H0se acepta siFes menor o igual que el valor críticoFα(2,norte−2). Desafortunadamente, la prueba no es muy
poderosa (es decir, casi siempre se rechaza), pero se pueden construir otras similares para hipótesis nulas más
interesantes como (a,b) = (Y,0).
4.2.1.4 El Coeficiente de Determinación R2

La figura 4.8 muestra la línea de regresión y algunos de los puntos de datos utilizados para estimarla. Si no hay valores de
X estaban disponibles, la mejor predicción deYiseríaY.Sin embargo, la figura muestra que para un determinado
150 deporte
Figura 4.8Desviaciones explicadas y no explicadas
valorXiel error de este método podría ser alto: (Yi−Y).CuandoXise conoce, por otro lado, la mejor
predicción paraYiesŶiy esto reduce el error a solo (Yi−Ŷi), es decir, se ha explicado gran parte del
error original. De la Figura 4.8 tenemos:
(Yi−Y) = (Ŷi−Y) + (Yi−Ŷi), ∀i

desviación total desviación explicada desviación inexplicable
Si elevamos al cuadrado las desviaciones totales y sumamos todos los valores dei, obtenemos lo siguiente:
∑ ∑ ∑
(Yi−Y)2 = (Ŷi−Y)2 + (Yi−Ŷi)2
i i i (4.10)
variación total variación explicada variación inexplicable
Ahora porque (Ŷi−Y) =b̂xies fácil ver que la variación explicada es función del coeficiente de regresión
estimadob. El proceso de descomposición de la variación total en sus partes se conoce comoAnálisis de
variaciónde la regresión, o ANOVA (tenga en cuenta que la varianza es solo la variación dividida por los
grados de libertad).
El coeficiente de determinación se define como la relación entre la variación explicada y la variación total:
(Ŷ i−Y) 2
R2= (4.11)
(Yi−Y) 2
Tiene valores límite de 1 (explicación perfecta) y 0 (ninguna explicación); los valores intermedios
pueden interpretarse como el porcentaje de la variación total explicada por la regresión. El índice está
trivialmente relacionado con la correlación de la muestra.R, que mide el grado de asociación entreXyY(ver
Wonnacott y Wonnacott 1990).
4.2.1.5 Regresión múltiple

Esto es una extensión de lo anterior para el caso de variables más explicativas y, obviamente, más regresores(b
parámetros). Las ecuaciones de solución son similares, aunque más complejas, pero surgen algunos problemas
extra que suelen ser importantes, como los siguientes:
1. Multicolinealidad. Esto ocurre cuando existe una relación lineal entre las variables explicativas.
Equivalente a lo que ocurrió cuando una variable explicativa era una función lineal del intercepto en
(4.6), en este caso las ecuaciones para los regresoresbno son independientes y no se pueden resolver
de forma única.
2. Cuántos regresores incluir. Para tomar una decisión en este caso, se deben tener en cuenta varios factores.-a
consideración:
¿Existen fuertes razones teóricas para incluir una variable dada, o es importante para la prueba de políticas?
con el modelo?
- ¿El signo estimado del coeficiente es coherente con la teoría o la intuición y la variable es
significativa (es decir, H0rechazado en elt-¿prueba?)?
En caso de duda, una forma de avanzar es sacar la variable en cuestión y volver a estimar la regresión para examinar
el efecto de su eliminación en el resto de los coeficientes; si esto no es demasiado importante, la variable se puede
omitir paraparsimonia(el modelo es más sencillo y el resto de parámetros se pueden estimar con mayor precisión).
Los paquetes de software comerciales proporcionan un procedimiento 'automático' para abordar este problema (el
paso a pasoacercarse); sin embargo, esto puede inducir algunos problemas, como comentaremos a continuación.
Volveremos a este problema general en la sección 8.4 (Tabla 8.1) cuando analicemos los problemas de especificación
del modelo de elección discreta.
3. Coeficiente de determinación. Tiene la misma forma que (4.11). Sin embargo, en este caso la inclusión de otro
regresor siempre aumentaR2; para eliminar este problema el corregidoR2Se define como:
R2= [R2−k/(norte−1)][(norte−1)/(norte−k−1)] (4.12)
dóndenorterepresenta el tamaño de la muestra como antes ykes el número de regresoresb.

En el modelado de generación de viajes, se ha utilizado el método de regresión múltiple con datos
agregados (zonales) y desagregados (hogares y personales). El primer enfoque prácticamente se ha
abandonado en el caso de las producciones de viajes, pero sigue siendo el principal método para modelar las
atracciones de los viajes. En este sentido, cabe señalar que las expresiones (4.11) y (4.12) tendrán valores
entre 0 y 1 si y solo si el modelo de mínimos cuadrados considera un intercepto, es decir, si el modelo (4.4) no
está obligado a consideraraigual a cero. Además, (4.12) es una buena herramienta para comparar modelos
siempre que las variablesYutilizados para los casos bajo análisis son los mismos. Por ejemplo, si el analista
quiere comparar un modelo para el número de viajes en función de los atributos de la zona y otro usando el
logaritmo del número de viajes, las medidas no son adecuadas ya que el denominador en (4.11) no es el
mismo para ambos modelos.
4. Prueba de hipótesis. Si el analista está interesado en probar una hipótesis con respecto a un estimador
específico, elt-Puede usarse la prueba descrita en (4.8). Sin embargo, si la hipótesis involucra una restricción
lineal entre muchos estimadores, unaF-test debe usarse en su lugar. En este caso necesitamos estimar
primero un restringidomodelo, donde se cumplen las restricciones a probar y calcular la Suma de Residuos al
Cuadrado del modelo Restringido (RSSR) que es igual aε2 i= (Yi−Ŷi)2y es a menudo una salida de
software de regresión. En segundo lugar, necesitamos estimar unirrestrictomodelo (es decir, donde no se imponen
las restricciones) y calcular elRSStu.Entonces elFestadística se calcula de la siguiente manera, dondekes el número de
variables en el modelo sin restricciones, yres el número de restricciones impuestas:
{RSSR − RSStu} (norte−k)

Fˆ = ∼Fr, n−k
RSStu r
Esta estadística sigue unaFdistribución conrynkgrados de libertad. La intuición de la prueba es la siguiente: si
las restricciones son verdaderas,RSSRdebe ser similar aRSStuy la estadística debe estar cerca de cero. Por el
contrario, si la estadística es mayor queFnkla hipótesis nula puede rechazarse para algún nivel de confianza
deseado.
4.2.2 Regresión múltiple basada en zonas
En este caso se intenta encontrar una relación lineal entre el número de viajes producidos o atraídos por
zona y las características socioeconómicas medias de los hogares de cada zona. Las siguientes son
algunas consideraciones interesantes:
1. Los modelos zonales solo pueden explicar la variación en el comportamiento de los viajes entre zonas. Por esta razón, solo
pueden tener éxito si las variaciones interzonales reflejan adecuadamente las verdaderas razones detrás de la variabilidad de
los viajes. Para que esto suceda, sería necesario que las zonas no sólo tuvieran una composición socioeconómica homogénea,
sino que representaran una gama de condiciones lo más amplia posible. Un problema importante es que las principales
variaciones en los datos de viaje de personas ocurren a nivel intrazonal.
2. Rol del intercepto. Uno esperaría que la línea de regresión estimada pasara por el origen; sin embargo, a
menudo se han obtenido valores de intercepción grandes (es decir, en comparación con el producto del valor
promedio de cualquier variable y su coeficiente). Si esto sucede, la ecuación puede ser rechazada; si por el
contrario, el intercepto no es significativamente diferente de cero, podría ser informativo reestimar la línea,
forzándola a pasar por el origen.
3. Zonas nulas. Es posible que determinadas zonas no ofrezcan información sobre determinadas variables
dependientes (p. ej. no pueden generarse viajes de MP en zonas no residenciales). Las zonas nulas deben ser
excluidas del análisis; aunque su inclusión no debería afectar mucho a las estimaciones de los coeficientes
(porque las ecuaciones deberían pasar por el origen), un incremento arbitrario en el número de zonas que no
proporcionen datos útiles tenderá a producir estadísticos que sobrestiman la precisión de la regresión
estimada.
4. Totales zonales versus medias zonales. Al formular el modelo, el analista parece tener la opción de
utilizar variables agregadas o totales, como viajes por zona y automóviles por zona, o tasas como
viajes por hogar por zona y automóviles por hogar por zona. En el primer caso el modelo de regresión
sería:
Yi=θ0+θ1X1i+θ2X2i+. . .+θkXki+mii
mientras que el modelo utilizando tasas sería:
yi=θ0+θ1X1i+θ2X2i+. . .+θkXki+mii
conyi=Yi/Hi;Xi=Xi/Hi;mii=mii/HiyHiel número de hogares en la zonai.

Ambas ecuaciones son casi idénticas, en el sentido de que buscan explicar la variabilidad del comportamiento de
los viajes entre zonas, y en ambos casos los parámetros tienen el mismo significado. Su diferencia única y
fundamental se relaciona con la distribución del término de error en cada caso; es obvio que la condición de varianza
constante del modelo no puede cumplirse en ambos casos, a menos queHifue constante para todas las zonasi.
Ahora bien, como las variables agregadas reflejan directamente el tamaño de la zona, su uso debería implicar que
la magnitud del error en realidad depende del tamaño de la zona; esteheterocedasticidad(la variabilidad de la
varianza) se ha encontrado en la práctica. Usando multiplicadores, como 1/Hi, permite reducir la heteroscedasticidad
porque el modelo se hace independiente del tamaño de la zona. En esta misma línea, también se ha encontrado que
las variables agregadas tienden a tener mayor intercorrelación (es decir, multicolinealidad) que las tasas. Es
importante señalar que los modelos que utilizan variables agregadas a menudo arrojan valores más altos deR2, pero
esto es solo un efecto espurio porque el tamaño de la zona obviamente ayuda a explicar el número total de viajes (ver
Douglas y Lewis 1970). Lo que ciertamente no es correcto es la mezcla de tasas y variables agregadas en un solo
modelo.
Para finalizar este tema, es importante señalar que incluso cuando se utilizan tasas, la regresión basada en zonas está
condicionada por la naturaleza y el tamaño de las zonas (es decir, el problema de la agregación espacial). Esto se
ejemplifica claramente por el hecho de que la variabilidad interzonal disminuye con el tamaño de la zona, como se
muestra en la Tabla 4.2, construida con datos de Perth (Douglas y Lewis 1970).
Cuadro 4.2Variación interzonal de producciones personales para dos

sistemas de zonificación diferentes
Valor medio de interzonal

sistema de zonificación viajes/hogar/zona diferencia
75 zonas pequeñas 8.13 5.85

23 grandes zonas 7.96 1.11
4.2.3 Regresión basada en el hogar

La variación intrazonal puede reducirse al disminuir el tamaño de la zona, especialmente si las zonas son homogéneas.
Sin embargo, zonas más pequeñas implican un mayor número de ellas y esto tiene dos consecuencias:
- modelos más caros en términos de recolección de datos, calibración y operación;

- errores de muestreo mayores, que el modelo de regresión lineal múltiple supone inexistentes.
Por estas razones, parece lógico postular modelos que sean independientes de los límites de zona. A principios de la
década de 1970 se creía que la unidad de análisis más adecuada en este caso era el hogar (y no el individuo); se
argumentó que una serie de interacciones interpersonales importantes dentro de un hogar no podrían incorporarse ni
siquiera implícitamente en un modelo individual (por ejemplo, disponibilidad de automóvil, es decir, qué miembro tiene
uso del automóvil). Esta tesis fue posteriormente cuestionada como veremos en la sección 4.3.3, pero con poco éxito
práctico.
En una aplicación basada en el hogar, cada hogar se toma como un vector de datos de entrada para incluir en el
modelo todo el rango de variabilidad observada sobre las características del hogar y su comportamiento de viaje. El
proceso de calibración, como en el caso de los modelos zonales, puede proceder paso a paso, probando cada variable
explicativa potencial hasta obtener el mejor modelo (en términos de algunas estadísticas de resumen para un nivel de
confianza dado). Se debe tener cuidado con los paquetes de computadora paso a paso automáticos porque pueden
omitir variables que son predictores ligeramente peores que otros que quedan en el modelo, pero que pueden resultar
mucho más fáciles de pronosticar.
De hecho, no se recomiendan los métodos graduales; es preferible proceder al revés,
es decir, probar un modelo con todas las variables disponibles y eliminar aquellas que no son esenciales (por motivos
teóricos o de política) y tienen poca significancia o un signo incorrecto.
Ejemplo 4.3Considere las variables viajes por hogar (Y), Numero de trabajadores (X1) y número de coches (X2). La Tabla
4.3 presenta los resultados de pasos sucesivos de la estimación de un modelo paso a paso; la última fila también muestra
(entre paréntesis) valores para elt-relación (ecuación 4.9). Suponiendo un tamaño de muestra grande, el número
apropiado de grados de libertad (norte−2) también es un número grande, por lo quet-los valores pueden compararse con
el valor crítico 1.645 para un nivel de significación del 95% en una prueba de una cola (sabemos que la hipótesis nula es
unilateral en este caso comoYdebe aumentar con ambosX1yX2).
Cuadro 4.3 Ejemplo de regresión por pasos
Paso Ecuación R2
1 Y=2.36X1 0.203
2 Y=1.80X1+ 1,31X2 0.325
3 Y=0,91 + 1,44X1+ 1.07X2
(3.7) (8.2) (4.2) 0.384
El tercer modelo es una ecuación razonable a pesar de su bajaR2. El intercepto 0.91 no es grande (compárelo con 1.44
veces el número de trabajadores, por ejemplo) y los coeficientes de regresión son significativamente diferentes de cero (H
0se rechaza en todos los casos). El modelo probablemente podría beneficiarse de la inclusión de más variables si
estuvieran disponibles.
Se puede obtener una indicación de qué tan buenos son estos modelos al comparar los viajes observados y
modelados para algunas agrupaciones de datos (ver Tabla 4.4). Esto es mejor que comparar totales porque en tales casos
diferentes errores pueden compensar y no se detectaría el sesgo. Como puede verse, la mayoría de las celdas muestran
una aproximación razonable (es decir, errores inferiores al 30%). Si se detectara un gran sesgo, sería necesario ajustar los
parámetros del modelo; sin embargo, esto no es fácil ya que no existen reglas claras para hacerlo y depende en gran
medida del contexto.
Tabla 4.4 Comparación de viajes por hogar (observados/estimados).
Número de trabajadores en el hogar
Nº de coches 0 1 2 3 o más
0 0,9/0,9 2.1/2.4 3.4/3.8 5.3/5.6

1 3.2/2.0 3.5/3.4 3.7/4.9 8.5/6.7
2 o más – 4.1/4.6 4.7/6.0 8.5/7.8
4.2.4 El problema de la no linealidad

Como hemos visto, el modelo de regresión lineal asume que cada variable independiente ejerce una influencia lineal
sobre la variable dependiente. No es fácil detectar la no linealidad porque relaciones aparentemente lineales pueden
resultar no lineales cuando se permite la presencia de otras variables en el modelo. Los gráficos multivariantes son útiles
en este sentido; el ejemplo de la Figura 4.9 presenta datos de hogares estratificados por propiedad de automóviles y
número de trabajadores. Se puede observar que el comportamiento de viaje no es lineal con respecto al tamaño de la
familia.
Es importante mencionar que hay una clase que muestra por lo general
un comportamiento no lineal (por ejemplo, tipo de edad, sexo).
permanencia En general, hay dos métodos para incorporar
Figura 4.9Un ejemplo de no linealidad

1. Transformar las variables para linealizar su efecto (ej. tomar logaritmos, elevar a una potencia). Sin embargo,
seleccionar la transformación más adecuada no es un ejercicio fácil ni arbitrario, por lo que es necesario tener
cuidado; además, si somos minuciosos, puede llevar mucho tiempo y esfuerzo.
2. Usoficticiovariables En este caso, la variable independiente considerada se divide en varios intervalos discretos
y cada uno de ellos se trata por separado en el modelo. De esta forma, no es necesario suponer que la
variable tiene un efecto lineal, porque cada una de sus partes se considera por separado en términos de su
efecto sobre el comportamiento de viaje. Por ejemplo, si la propiedad de automóviles se tratara de esta
manera, los intervalos apropiados podrían ser 0, 1 y 2 o más automóviles por hogar. Como cada hogar
muestreado solo puede pertenecer a uno de los intervalos, la variable ficticia correspondiente toma el valor 1
en esa clase y 0 en las demás. Es fácil ver que sólo (norte−1) se necesitan variables ficticias para representar
norteintervalos
Ejemplo 4.4Considere el modelo del ejemplo 4.3 y suponga que la variableX2se sustituye por los
siguientes dummies:
Z1, que toma el valor 1 para los hogares con un coche y 0 en el resto de los casos;
Z2, que toma el valor 1 para los hogares con dos o más coches y 0 en el resto de los casos.
Es fácil ver que los hogares sin automóvil corresponden al caso en que ambosZ1yZ2son 0. El
modelo del tercer paso en la Tabla 4.3 sería ahora:
Y=0.84 + 1.41X1+ 0.75Z1+ 3.14Z2 R2= 0.387

(3.6) (8.1) (3.2) (3.5)
Incluso sin el mejorR2valor, este modelo sería preferible al anterior solo porque el efecto
no lineal deX2(oZ1yZ2) está libre de variables ficticias, por ejemplo, 1 por hogar, el efecto sería
eficientes
claramente li wo coches
10
Figura 4.10Modelo de regresión con variables ficticias

Al observar la Figura 4.10, surge la siguiente pregunta: ¿no sería preferible estimar regresiones separadas para los
datos de cada grupo, ya que en ese caso no requeriríamos que cada línea tuviera la misma pendiente (es decir, el
coeficiente deX1)? La respuesta es en generalNoa menos que tuviéramos una cantidad razonable de datos para cada
clase. El hecho es que el modelo con dummies usa todos los datos, mientras que cada regresión separada usaría solo una
parte de ellos, y esto es en general una desventaja. También es interesante mencionar que el uso de variables ficticias
tiende a reducir los problemas de multicolinealidad en los datos (ver Douglas y Lewis 1971).
4.2.5 Obtención de Totales Zonales
En el caso de los modelos de regresión basados en zonas, esto no es un problema ya que el modelo se estima precisamente en
este nivel. Sin embargo, en el caso de los modelos basados en el hogar, se requiere una etapa de agregación. Sin embargo,
precisamente porque el modelo es lineal, el problema de agregación se resuelve de manera trivial reemplazando los valores
zonales promedio de cada variable independiente en la ecuación del modelo y luego multiplicándolo por el número de hogares en
cada zona. Sin embargo, debe tenerse en cuenta que la etapa de agregación puede ser un asunto muy complejo en modelos no
lineales, como veremos en el Capítulo 9.
Así, para el tercer modelo de la Tabla 4.3 tendríamos:
Ti=Hi(0.91 + 1.44X1i+1.07X2i)
dóndeTies el número total de viajes HB en la zonai,Hies el número total de hogares en él yXJies el

valor medio de la variableXjpara la zona.
Por otro lado, cuando se utilizan variables ficticias, también es necesario conocer el número de
hogares en cada clase para cada zona; por ejemplo, en el modelo del Ejemplo 4.4 requeriríamos:
Ti=Hi(0.84 + 1.41X1i) +0.75H1i+3.14H2i
dóndeHJies el número de hogares de clasejen la zonai.

Esta última expresión nos permite apreciar otra ventaja de usar variables ficticias sobre regresiones
separadas. Para agregar los modelos en este último caso, sería necesario estimar el número promedio de
trabajadores por hogar (X1) para cada grupo de propietarios de automóviles en cada zona, y esto puede ser
complicado para los pronósticos a largo plazo.
4.2.6 Coincidencia de generaciones y atracciones
Puede ser obvio para algunos lectores que los modelos anteriores no garantizan, por defecto, que el número
total de viajes que se originan (elorígenes Oi) en todas las zonas será igual al número total de viajes atraídos (el
destinos Dj) para ellos, es decir, la siguiente expresión no se cumple necesariamente:
∑ ∑
Oi= Dj (4.13)
i j
El problema es que esta ecuación es requerida implícitamente por el siguiente submodelo (es decir, la distribución de
viajes) en la estructura; no es posible tener una matriz de distribución de viajes donde el número total de viajes (T)
obtenido al sumar todas las filas es diferente al obtenido al sumar todas las columnas (ver Capítulo 5).
La solución a esta dificultad es una solución pragmática que aprovecha el hecho de que normalmente los modelos de
generación de viajes son mucho 'mejores' (en todos los sentidos de la palabra) que sus contrapartes de atracción de
viajes. Los primeros suelen ser modelos basados en el hogar bastante sofisticados con buenas variables explicativas.
Los modelos de atracción de viajes, por otro lado, se estiman en el mejor de los casos utilizando datos zonales. Por ello, la
práctica habitual considera que el número total de viajes resultantes de sumar todos los orígenesOies de hecho la cifra
correcta paraT; por lo tanto, todos los destinosDjse multiplican por un factorFdada por:
/∑
F=T Dj (4.14)
j
que obviamente aseguran que su suma también se suma aT.
4.3 Clasificación cruzada o análisis de categorías

4.3.1 El modelo clásico
Aunque la regresión lineal fue el primer enfoque recomendado para la generación de viajes, desde finales de la
década de 1960 apareció un método alternativo para modelar la generación de viajes y rápidamente se
estableció como el preferido en el Reino Unido. El método era conocido comoanálisis de categoríasen el Reino
Unido (Wootton y Pick 1967) yclasificación cruzadaen los EE.UU; allí pasó por un proceso de desarrollo similar al
del modelo de regresión lineal, siendo los primeros procedimientos a nivel zonal y los modelos posteriores
basados en información de los hogares.
El método se basa en estimar la respuesta (por ejemplo, el número de viajes producidos por hogar para un propósito
determinado) en función de los atributos del hogar. Su supuesto básico es que las tasas de generación de viajes son
relativamente estables en el tiempo para ciertas estratificaciones de hogares. El método encuentra estas tasas
empíricamente y para ello normalmente necesita grandes cantidades de datos; de hecho, un elemento crítico es el
número de hogares en cada clase. Aunque el método se diseñó originalmente para usar datos del censo en el Reino
Unido, un problema grave del enfoque sigue siendo la necesidad de pronosticar el número de hogares en cada estrato en
el futuro.
4.3.1.2 Definición de variable y especificación del modelo
Dejartpag(h) sea el promedio de viajes con propósitopag(y en un período de tiempo determinado) realizadas por miembros de
hogares de tipoh. Los tipos se definen por la estratificación elegida; por ejemplo, una clasificación cruzada basada enmetrotamaños
de hogar ynortelas clases de propiedad de automóviles produciránMinnesotatiposh. El método estándar para calcular estas tasas
de celda es asignar los hogares en los datos de calibración a las agrupaciones de celdas individuales y totalizar, celda por celda, los
viajes observados.Tpag(h) por grupo de propósito. la tarifatpag(h) es entonces el número total de viajes en la celdah, por propósito,
dividido por el número de hogaresH(h) en eso. En forma matemática es simplemente como sigue:
tpag(h) =Tpag(h)/h(h) (4.15)
El 'arte' del método radica en elegir las categorías de modo que se minimicen las desviaciones estándar de las
distribuciones de frecuencia representadas en la Figura 4.11.
El método tiene, en principio, las siguientes ventajas:
1. Los agrupamientos de clasificación cruzada son independientes del sistema de zonas del área de estudio.
2. No se requieren suposiciones previas sobre la forma de la relación (es decir, ni siquiera tienen que ser
monótonas, y mucho menos lineales).
3. Las relaciones pueden diferir en la forma de una clase a otra (por ejemplo, el efecto de los cambios en el tamaño del hogar para uno o dos
hogares propietarios de automóviles puede ser diferente).
158 transporte
Figura 4.11Distribución de la tasa de viajes por tipo de hogar
Y al igual que los métodos tradicionales de clasificación cruzada, también tiene varias desventajas:
1. El modelo no permite la extrapolación más allá de sus estratos de calibración, aunque la clase más baja o más
alta de una variable puede ser abierta (por ejemplo, hogares con dos o más automóviles y cinco o más
residentes).
2. No hay medidas estadísticas de bondad de ajuste para el modelo, por lo que solo se puede determinar la cercanía
agregada a los datos de calibración, pero vea la discusión en 4.3.2.
3. Se requieren muestras excesivamente grandes; de lo contrario, la confiabilidad de los valores de las celdas variará debido a las
diferencias en el número de hogares disponibles para la calibración en cada uno. Por ejemplo, en el Estudio de Transporte/Uso
de la Tierra de Monmouthshire (ver Douglas y Lewis 1971) se encontraron los estimadores para 108 categorías (seis niveles de
ingreso, tres niveles de propiedad de automóviles y seis niveles de estructura del hogar) que se muestran en la Tabla 4.5,
usando una muestra de 4000 hogares
Cuadro 4.5 Distribución de frecuencias de los hogares
Nº de categorías
21 69 9 7 2
No. de hogares encuestados 0 1–49 50–99 100–199 200+
La sabiduría aceptada sugiere que se requieren al menos 50 observaciones por celda para estimar la media de manera
confiable; por lo tanto, este criterio se cumpliría en solo 18 de las 108 celdas para una muestra de 4000 hogares. Puede haber
cierto margen para usar muestreo estratificado para garantizar tamaños de muestra distribuidos de manera más uniforme en
cada categoría. Esto implica, sin embargo, costos de encuesta adicionales.
4. No existe una forma efectiva de elegir entre las variables para la clasificación, o de elegir las mejores agrupaciones de
una variable dada; la minimización de las desviaciones estándar insinuadas en la Figura 4.11 requeriría un extenso
procedimiento de 'ensayo y error' que puede considerarse inviable en estudios prácticos.
4.3.1.3 Aplicación del Modelo a Nivel Agregado
Denotemos porqel tipo de persona (es decir, con y sin coche), porai(h) el número de hogares de tipohen la zonai,
y porHq(h) el conjunto de viviendas de tipohque contiene personas de tipoq. Con esto nosotros
puede escribir las producciones de viaje con propósitopagpor tipo de personaqen la zonai,Oqp i,como sigue:
Oiqp= ∑
ai(h)tpag(h) (4.16)
h∈sede(h)
Para verificar cómo funciona el modelo, es posible comparar estos valores modelados con los valores observados de la
muestra de calibración. Los errores inevitables se deben al uso de promedios para las tasas.tpag(h); uno esperaría una
mejor estratificación (en el sentido de minimizar la desviación estándar en la Figura 4.11) para producir errores más
pequeños.
Hay varias formas de definir las categorías de hogares. La primera aplicación en el Reino Unido (Wootton y Pick 1967)
empleó 108 categorías de la siguiente manera: seis niveles de ingresos, tres niveles de propiedad de automóviles (0, 1 y 2
o más automóviles por hogar) y seis agrupaciones de estructuras de hogares, como en la Tabla 4.6.
Cuadro 4.6 Ejemplo de agrupación de la estructura del hogar
Grupo Nº de empleados Otros adultos
1 0 1
2 0 2 o más
3 1 1 o menos
4 1 2 o más
5 2 o más 1 o menos
6 2 o más 2 o más
El problema es claramente cómo predecir el número de hogares en cada categoría en el futuro. El método más
comúnmente utilizado (ver Wilson 1974) consiste, en primer lugar, en definir y ajustar a los datos de calibración,
distribuciones de probabilidad para el ingreso (I), propiedad del carro (C) y la estructura del hogar (S); en segundo lugar,
utilizarlos para construir una función de probabilidad conjunta de pertenecer al tipo de hogarh= (I,C,S). Por lo tanto, si la
función de distribución conjunta se denota porφ(h) =φ(I,C,S), el número de hogares en la zonai perteneciente a la claseh,a
i(h), está simplemente dada por:
ai(h) =Hi·φ(h) (4.17)
dóndeHies el número total de hogares en la zona. Este modelo de estimación de hogares puede probarse parcialmente
ejecutándolo con los datos del año base utilizados en la calibración. Los viajes totales estimados con la ecuación (4.16),
pero con valores simulados paraai(h), luego se puede comparar con las observaciones reales. Una desventaja adicional
del método se puede agregar en esta etapa:
5. Si se requiere aumentar el número de variables estratificadoras, podría ser necesario aumentar

enormemente la muestra. Por ejemplo, si se agrega otra variable a laoriginalaplicación discutida
anteriormente y esto se dividió en tres niveles, el número de categorías aumentaría de 108 a 324 (y
recuerde la discusión en la Tabla 4.5).
4.3.2 Mejoras al Modelo Básico

4.3.2.1 Equivalencia entre análisis de categorías y regresión lineal
Algunas de las limitaciones del modelo básico anterior se pueden superar si se observa que los estimadores del análisis de
categorías se pueden obtener usando un modelo de regresión lineal con variables ficticias que representan cada uno.
categoría (Goodman 1973). Este resultado se puede mostrar fácilmente recordando que si una variable ficticia es
definido para cada categoría, esto es equivalente a ejecutar modelos de mínimos cuadrados separados sin más
variables que una intersección. Entonces, de la ecuación (4.5), se sigue directamente que el estimador de mínimos
cuadrados es idéntico al promedio deYpara cada categoría.
(continuado)
Dada esta equivalencia, desaparece la desventaja contar con medidas estadísticas de bondad de ajuste para la R2
de no modelar. Se puede utilizar, por ejemplo, el medida (4.12) para comparar diferentes potenciales
estructuras de categorías; sin embargo, se necesita un d. Para hacerR2comparables entre diferentes modelos
pequeño cambio y se restringe entre 0 y 1, no es necesario consideran un intercepto, pero en ese caso el modelo
norte
que sea identificable porque la categoría dummies sumaría uno (es decir, igual al intercepto). Como se
señalada por Guevara y Thomas (2007), esto puede ser y resuelve estableciendo una de las categorías como la base
usar dummies para todos los demás. Entonces, la m de la odel intercepto corresponde a la tasa de viaje estimada con
categoría base y los estimadores asociados cada otra variable ficticia corresponderá
a la diferencia entre la tasa de viaje del respectivo categoría activa y aquella utilizada como base. ElR2
calculado de esta manera y también laF-test pueden ser se utiliza para comparar diferentes agrupaciones de alternativas
variables para la estratificación.
Igualmente, el analista puede utilizar lat-test (4.8) como medida estadística de la confiabilidad del sider
estimaciones en cada categoría. El analista puede cotejar válido, por ejemplo, solo estratificaciones para % nivel
norte
que los estimadores son diferentes a cero en el 9 5de confianza.

Otra limitación práctica del modelo básico es que la is que en algunos casos el número de observaciones en ng
muestra es demasiado pequeña o incluso inexistente, lo las estimaciones de tasas de viaje para algunas categorías.
que impide que el analista esté interesado en tener una estimación para tales categorías existe la siguiente
alternativa; si se supone que el impacto de a es nivel variable adicional en el número de viajes tarde
norte
independiente de otras variables, se pueden formar los tuun modelo lineal que depende de cada uno de los t el
niveles de las variables. Por ejemplo, si consideramos la número de viajes depende de Renta y Coche
propiedad, y que esas variables se dividen en autos), se a dos niveles (ingresos bajos y altos; 0 y 1+ ted:
norte
podría formular el siguiente modelo lineal a

Excursionesi=θILLINOISIYo bajo+θyoIAlto i+θMETRO0METRO0i+θMETRO1METRO1i+mii
dóndeIBajoes igual a 1 si el hogar pertenece Otras s a la categoría de bajos ingresos y cero en caso contrario.
variables se definen de manera equivalente ymiico rresponde a un término de error.
Sin embargo, se puede señalar que este modelo notimable ya que hay un problema de multicolinealidad,
es tanIBajo+IAlto=METRO0+METRO1=1. Para lograr est es,imation el modelo necesita ser normalizado, que
utilizar algunas de las categorías como base o r mi
referencia Esto puede lograrse, por ejemplo, mediante
considerando el modelo (4.18), donde también incluimos d una intercepción para hacer elR2comparable entre
diferentes modelos:
Excursionesi=α+αyoIHola gh yo+αMETRO1METRO1i+mii (4.18)

De ello se deduce que incluso si no tenemos, por ejemplo, y metro
Por ejemplo, las observaciones para los hogares de bajos ingresos
alta motorización, sus tasas de viaje pueden ser calc efecto se calculan comoα̂+α̂METRO1si aceptamos la hipótesis de un número de
lineal de los ingresos y la propiedad de automóviles en el n viajes.
Por otro lado, incluso si hay suficientes observaciones, rvaciones para estimar las tasas de viaje para todas las
ocategorías, del tipo (4.18); ya que implica la estimación
el analista puede estar interesado en estimar am de menos
parámetros con los mismos datos, se puede probar la d dan como resultado estimadores con varianza más pequeña.
hipótesis, por ejemplo, agregando deIBajovecesMETRO1o, Se puede demostrar que esta interacción no lineal calculada
de manera equivalente, un hogar motorizado de ingreso bcomo el producto le por el efecto combinado de pertenecer a
variable ficticio. Esta alternativa es una variable ficticia por un del alto es equivalente a considerar
categoría.
Excursionesi=α+αyoIYo alto+αMETRO 1METRO1i+αMIIYo alto·METRO1i+mi′ i
La validez de este supuesto lineal puede ser variables probado comprobando la importancia conjunta de los
de interacción a través de unF-test, como describe el d en 4.2.1.5. En este casok=4 yr=1, porque nuestros
modelo no restringido implica la estimación de f ocoeficientes y solo uno de ellos está restringido
a cero en el modelo restringido (4.18). ElRSSRcorresponde al modelo (4.18) y elRSStual modelo incluyendoIBajo•
METRO1. Si la estadística es menor que el valor críticoFnk, se acepta la hipótesis nula, lo que significa que el
modelo lineal (4.18) es aceptable. Si la estadística es mayor queFnkse debe considerar el modelo con
interacciones. Vale la pena señalar que dado que en este caso el término de interacción involucra la inclusión
de solo una variable adicional, elt-estadístico (4.8) también podría usarse pero elF-La prueba es la
herramienta aplicada en general.
Otra prueba interesante, más allá del supuesto de linealidad, tiene que ver con la posibilidad de utilizar una
variable adicional para la clasificación, por ejemplo, el tamaño del hogar. En tal caso, se puede estimar el siguiente
modelo, dondeSLtomaría el valor uno si el tamaño del hogar es grande y cero en caso contrario, digamos:
Excursionesi=α+αyoIYo alto+αMETRO1METRO1i+αS3SYo+mi" i
Para saber si la inclusión del tamaño del hogar es una buena idea, unF-test se puede utilizar en general y unt-test
en el caso particular de necesitar solo una variable adicional para hacerlo; Sin embargo, el nivel de significación que
se utilizará en este último caso merece cierta atención. El procedimiento habitual es considerarlo lo más pequeño
posible, generalmente un 5%, para reducir los errores de tipo I (es decirrechazar la hipótesis nula cuando es
verdadera). Sin embargo, como excluir el tamaño del hogar puede causar endogeneidad, porque la variable puede
estar correlacionado con los ingresos o la propiedad del automóvil, el costo de excluirlo cuando debería estar allí
(error de tipo II) puede ser mayor que el costo de incluirlo si no se debe considerar (error de tipo I). Dado que existe
una compensación entre los errores de tipo I y tipo II, puede ser recomendable considerar un nivel de significación
del 10 % o incluso del 20 % en este caso.
Otra posibilidad es que el analista desee explorar la validez del umbral utilizado para definir los estratos
de ingresos altos y bajos, por ejemplo. Esto se puede lograr fácilmente ejecutando una regresión
considerando los umbrales alternativos y comparando losR2de ambos modelos. En general, el modelo con
mayorR2debe preferirse, ya que explicará una porción más grande de la varianza. Sin embargo, si
el modelo con el mayorR2da como resultado signos o tamaños de coeficientes irrazonables, o si afecta su
significado, se debe elegir la alternativa en su lugar.
Guevara y Thomas (2007) señalan que incluso después de todas las mejoras potenciales en la categoría
Análisis descrito anteriormente, elR2de este tipo de modelos suelen ser muy bajos (es decir, menos de 0,2 o
0,3). Esto no es sorprendente ya que el modelo es de hecho extremadamente simplista. La consideración de
relaciones más realistas entre las variables explicativas y el número de viajes puede lograrse mediante
regresión lineal. Los modelos descritos en la siguiente subsección representan una mejora en esa dirección.
4.3.2.2 Análisis de regresión para estratos de hogares
Una combinación de clasificación cruzada y modelos de regresión de la generación de viajes puede ser el enfoque más
apropiado en ciertas ocasiones. Por ejemplo, en un área donde la distribución del ingreso es desigual, puede ser
importante medir el impacto diferencial de las políticas en diferentes grupos de ingresos; por lo tanto, puede ser
necesario modelar la demanda de viajes para cada grupo de ingresos por separado durante todo el proceso de
modelado. Supongamos ahora que en la misma área la propiedad de automóviles está aumentando rápidamente y,
como de costumbre, no está claro qué tan correlacionadas están estas dos variables; una salida útil puede ser postular
modelos de regresión basados en variables que describen el tamaño y la composición de los diferentes hogares, para
una estratificación según las dos variables anteriores.
Ejemplo 4.5La Tabla 4.7 presenta las 13 categorías de ingresos y propiedad de automóviles (Ci) definida en ESTRAUS (1989) para los
datos origen-destino del Gran Santiago 1977. Como se puede observar, el grueso de los datos corresponde a hogares sin automóvil
y de bajos ingresos. También tenga en cuenta que las categorías 7 y 10 tienen bastante
pocos puntos de datos; este es, desafortunadamente, un problema general de este enfoque. Incluso las muestras más pequeñas para ingresos
muy bajos y propiedad de automóviles alta llevaron a la agregación de algunas categorías en este rango.
Tabla 4.7Estratificación de la muestra de Santiago de 1977
Propiedad de automóviles domésticos
Ingresos del hogar (US$/mes) 0 1 2+ Total
<125 6 564 (C1) 215 (C2) 6 779

125–250 4 464 (C3) 627 (C4) 5 091
250–500 1 532 (C5) 716 (C6) 87 (C7) 2 334
500–750 305 (C8) 436 (C9) 118 (C10) 859
> 750 169 (C11) 380 (C12) 301 (C13) 790
Total 12 974 2 373 506 15 853
Las variables independientes disponibles para el análisis (es decir, después de omitir las variables estratificadoras)
incluyeron variables deletapa en el ciclo familiarvariedad, de la que hablaremos en el apartado 4.4. Sin embargo, luego de
extensas búsquedas de especificaciones, se encontró que las variables más significativas eran: número de trabajadores
(divididos en cuatro clases según los ingresos y el tipo de trabajo), número de estudiantes y número de residentes.
Los modelos de regresión lineal estimados con estas variables para cada una de las 13 categorías se consideraron
satisfactorios sobre la base de signos correctos, interceptos pequeños, niveles de significación razonables yR2(por
ejemplo, entre 0,401 para la categoría 4 y 0,682 para la categoría 7; véase Hally otros. 1987).
Finalmente, un supuesto que se puede levantar en este caso y que puede mejorar aún más el ajuste y la calidad de los
modelos, es aceptar que algunos coeficientes pueden ser los mismos en todas las categorías. Esto supondrá la
estimación conjunta de los 13 modelos y producirá necesariamente un aumento de la eficiencia, es decir, una reducción
de la varianza de los estimadores.
4.3.3 El enfoque de categoría de persona
Esta es una alternativa a los modelos basados en el hogar discutidos anteriormente, que fue propuesto
originalmente por Supernak (1979). Se argumentó que este enfoque ofrecía las siguientes ventajas (Supernak y
otros. 1983):
1. Un modelo de generación de viajes a nivel de persona es compatible con otros componentes del sistema de modelado de
demanda de transporte clásico, que se basa en los realizadores de viajes en lugar de en los hogares.
2. Permite un esquema de clasificación cruzada que usa todas las variables importantes y produce un número manejable
de clases; esto, a su vez, permite pronosticar más fácilmente la representación de clases.
3. El tamaño de muestra requerido para desarrollar un modelo de categoría de persona puede ser varias veces más pequeño que el
requerido para estimar un modelo de categoría de hogar.
4. Los cambios demográficos pueden explicarse más fácilmente en un modelo de categoría de persona ya que, por ejemplo, ciertas
variables demográficas clave (como la edad) son prácticamente imposibles de definir a nivel de hogar.
5. Las categorías de personas son más fáciles de pronosticar que las categorías de hogares, ya que estas últimas requieren
pronósticos sobre la formación del hogar y el tamaño de la familia; estas tareas se evitan por completo en el caso de categorías
de personas. En general el grueso de los viajes lo realizan personas mayores de 18 años; esta población es más fácil de
pronosticar con 15 a 20 años de anticipación, ya que solo se necesitan tasas de migración y supervivencia para hacerlo.
La mayor limitación que puede tener un modelo de categoría persona se relaciona precisamente con la principal razón por la
que se optó por modelos basados en el hogar para reemplazar los modelos basados en zonas a fines de la década de 1960; esta
es la dificultad de introducir los efectos de interacción de los hogares y los costos monetarios y los presupuestos monetarios de los
hogares en un modelo basado en la persona. Sin embargo, Supernaky otros. (1983) argumentan que no está claro cuán vitales son
estas consideraciones y cómo pueden incorporarse efectivamente incluso en un modelo basado en el hogar; de hecho, de nuestra
discusión en las secciones 4.2.3 y 4.3.1 queda claro que esto se hace solo de manera implícita.
4.3.3.2 Definición de variable y especificación del modelo
DejartjSea la tasa de viaje, es decir, el número de viajes realizados durante un cierto período de tiempo por (el promedio)
persona en categoríaj;tjpes la tasa de viaje por propósitopag.Ties el número total de viajes realizados por los habitantes de
la zonai(todas las categorías juntas).norteies el número de habitantes de la zonai, yαJies el porcentaje de habitantes de la
zonaiperteneciente a la categoríaj. Por lo tanto existe la siguiente relación básica:
∑
Ti=nortei αJitj (4.19)
j
Al igual que en otros métodos, los viajes se dividen en con base en el hogar (HB) y sin base en el hogar (NHB), y se pueden dividir
además según el propósito (pag) que pueden aplicarse tanto a viajes HB como NHB.
El desarrollo del modelo implica las siguientes etapas:
1. Consideración de varias variables que se espera que sean importantes para explicar las diferencias en la movilidad
personal. Además, la definición de categorías de personas plausibles utilizando estas variables.
2. Análisis preliminar de las tasas de viaje para conocer qué variables tienen menor poder explicativo y
pueden ser excluidas del modelo. Esto se hace comparando las tasas de viaje de las categorías que se
diferencian únicamente por la variable analizada y probando si sus diferencias son estadísticamente
significativas.
3. Análisis detallado de las características del viaje para encontrar variables que definan categorías similares. Se excluyen
las variables que no brindan una explicación sustancial de la varianza de los datos o las variables que duplican la
explicación brindada por otras variables mejores (es decir, más fáciles de pronosticar o más sensibles a las políticas).
El ejercicio se lleva a cabo bajo la restricción de que el número de categorías finales no debe exceder un cierto
máximo práctico (por ejemplo, 15 clases).
Para este análisis se pueden utilizar las siguientes medidas: el coeficiente de correlación (Rjk), pendiente (
metrojk) e interceptar (ajk) de la regresióntjp=ajk+metrojktkp. las categoriasjykpueden ser tratados como similares si
estas medidas cumplen las siguientes condiciones (Supernaky otros. 1983):
Rjk>0.900
0.75<metrojk<1.25 (4.20)
ajk<0.10
Estas condiciones son bastante exigentes y pueden cambiar.
4.3.3.3 Aplicación del Modelo a Nivel Agregado

Las producciones zonales basadas en el hogar se calculan de manera sencilla utilizando la ecuación (4.19), o una versión
más desagregada que incluye explícitamente el propósito del viaje si se desea. Sin embargo, la estimación de las
atracciones de viajes en general y las producciones de viajes de NHB a nivel zonal es más complicada y requiere el
desarrollo dead hoclos métodos dependen en gran medida del tipo de información disponible en cada aplicación (ver
Supernak 1979 para un ejemplo polaco).
4.4 Generación de viajes y accesibilidad

Como mencionamos en el Capítulo 1, la especificación clásica del modelo de planificación del
transporte urbano (cuatro etapas) incorpora un proceso iterativo entre la distribución y
asignación de viajes que deja inalterada la generación de viajes. Esto es cierto incluso en el
caso de formas más contemporáneas que intentan resolver adecuadamente el complejo
problema de equilibrio entre la oferta y la demanda, como veremos en el Capítulo 11. Una
desventaja importante de este enfoque es que se supone que los cambios en la red no
tienen efectos. en viaje producciones y atracciones. Esto significaría, por ejemplo, que la
extensión de una línea de metro a un lugar que antes no tenía servicio no generaría más
viajes entre esa zona y el resto. Aunque esta suposición puede ser válida para viajes
obligatorios, puede no serlo en el caso de viajes discrecionales (por ejemplo,
Para resolver este problema, los modeladores han intentado incorporar una medida de accesibilidad (es decir, facilidad
o dificultad de hacer viajes hacia/desde cada zona) en ecuaciones de generación de viajes; el objetivo es reemplazar
i=f hnorte i porOi=f hnorte i, Anortei,dóndeHnorteison las características del hogar yAnorteies una medida de
norte
Onorte
Accesibilidad por tipo de persona.

Las medidas típicas de accesibilidad toman la forma general:
∑
i=
Anorte F(minorte j , Cyo)
j
dóndeminorteies una medida de atracción de la zonajyCyoel costo generalizado de viajar entre zonasiy
j. Una expresión analítica típica utilizada con este fin ha sido:
∑
i=
Anorte jexp(−βCyo)
minorte
dóndeβes un parámetro de calibración del modelo de gravedad, como se explica en el Capítulo 5.

Desafortunadamente, este procedimiento rara vez ha producido los resultados esperados en el caso de aplicaciones
de modelado urbano agregado porque los parámetros estimados de la variable accesibilidad han sido no significativos o
de signo incorrecto. Este tema ha permanecido de gran actualidad durante muchos años y está claramente relacionado
con dos problemas interesantes y aún no resueltos: la dinámica del modelo y el modelado con datos longitudinales en
lugar de transversales (Capítulo 1). Ortuzary otros. (2000b) brindan una discusión interesante del problema y ofrecen un
ejemplo de lo que se puede ganar al usar datos de preferencias declaradas en este contexto.
El trabajo realizado en el Reino Unido sobre tráfico inducido en la evaluación de esquemas de carreteras troncales
(Departamento de Transporte 1997) le dio un nuevo énfasis a los modelos de generación de viajes elásticos. Este trabajo
ha llevado al estudio de métodos de generación de viajes sensibles a cambios en la accesibilidad, ya que se reconoce que
los métodos clásicos no son adecuados en este sentido. Daly (1997) propone un marco de tres componentes para la
generación de viajes:
- El individuo en su contexto doméstico formula un patrón de actividad para el período a modelar,

decir un día. Las actividades fuera del hogar son, por supuesto, las únicas actividades que generan viajes.
- Las actividades fuera del hogar se organizan en 'estancias', que se definen como estadías en un lugar específico, cada
una de las cuales tiene un propósito principal (y posiblemente también propósitos secundarios en el mismo lugar).
- Se formula un plan de viaje para vincular las estancias, en particular decidiendo cuáles deben ser visitadas por visitas
separadas desde el hogar (dos o más viajes) y cuáles pueden vincularse con otras estancias mediante viajes fuera del
hogar.
A partir de aquí, parece razonable tratar de modelar el número de estancias generadas por un hogar o una persona, y
dividir esas estancias entre viajes basados en el hogar y viajes no basados en el hogar. Un punto de modelado práctico
que se desprende inmediatamente de este marco es que las variables dependientes (es decir,
número de giras y/o viajes, o alternativamente número de estancias que se pueden alcanzar) serán números
enteros: 0, 1, 2, 3, etc. Además, la decisión entre viajar o no (es decir, entre 0 y 1) puede cabe esperar que se
tome sobre una base diferente a la decisión de realizar más de un viaje (la primera decisión es si participar en
una actividaden absoluto, y el segundo es cómo organizar el tiempo y el lugardadoque alguna participación
tendrá lugar). Otro punto es que se deben incluir los viajes en todos los modos para garantizar que se
consideren todas las actividades fuera del hogar; por lo que la exclusión de viajes cortos o viajes en modos no
motorizados restará calidad al modelo. Por lo tanto, esto es consistente con el enfoque contemporáneo para la
recopilación de datos O-D discutido en el Capítulo 3.
Las variables que se incluirán en el modelo son las mismas que en los métodos clásicos discutidos anteriormente, pero se
espera que se pueda incorporar la accesibilidad. Sin embargo, puede haber una influencia cruzada negativa entre las
accesibilidades en el hogar y fuera del hogar; por ejemplo, si los viajes desde el hogar se pueden realizar fácilmente (es decir, en un
pueblo pequeño), se necesitarán menos viajes que no sean desde el hogar.
Se deben hacer predicciones del número de estadías para cada propósito de viaje (y tenga en cuenta que las variables que
influyen en cada tipo pueden variar). Lógicamente deberíamos modelar primero los propósitos obligatorios y luego se pueden
modelar los propósitos no obligatorios, condicionados a las decisiones tomadas para los propósitos obligatorios. De manera
similar, la elección entre satisfacer una necesidad de viaje mediante un recorrido basado en el hogar o un viaje no basado en el
hogar como un desvío en un recorrido planificado previamente debe modelarse explícitamente (Algersy otros. 1995), pero los
modelos independientes son concebibles en aras de la simplicidad. Finalmente, aunque se pueden establecer modelos de
frecuencia de viajes para describir el comportamiento de hogares completos (es decir, considerando todas las interacciones que
pueden ser relevantes para el número de viajes realizados), el desarrollo de modelos basados en personas es mucho más simple
en la práctica, dada la datos que normalmente están disponibles.
4.5 El modelo logit de elección de frecuencia

Daly (1997) discutió varios modelos, concluyendo que el más adecuado era uno con forma Logit (ver
Capítulo 7) y que predeciría el número total de viajes calculando primero la probabilidad de que cada
individuo optara por hacer un viaje. El volumen total de viajes se puede obtener multiplicando el
número de personas de cada tipo por sus probabilidades de realizar un viaje. A continuación se
presenta la extensión necesaria para tratar con personas que realizan más de un viaje.
SiVes la utilidad de hacer un viaje (asumiendo que la utilidad de no viajar es cero, sin pérdida de
generalidad), la probabilidad de hacer un viaje viene dada por:
1
PAG1=
1 + exp(−V)
dóndeVgeneralmente se especifica como una función lineal de parámetros desconocidosθ:
∑
V= θkXk
k
dóndeXson elementos de datos medidos, como ingresos, propiedad de automóviles y tamaño del hogar, y la
accesibilidad que debe ingresarse en una forma consistente con la teoría de maximización de la utilidad (es
decir, la teoría detrás del modelo Logit). Para esto, la forma preferida es usar un resultado de Williams (1977)
popularizado por Ben-Akiva y Lerman (1979), que establece que la forma correcta de accesibilidad es la
'logsum' del modelo de elección de destino (o modo). ; además, y como discutimos en la sección 7.4, debido a
que en este caso tenemos una estructura de Logit anidado, el parámetro que multiplica la variable de
accesibilidad logsum debe estar entre 0 y 1. Si esta condición no se cumple, las predicciones del modelo
pueden violar el sentido común ( Williams y Sénior 1977).
(continuado)
El modelo Logit representa la elección de cada medio y individuo si desea o no realizar un viaje, y estos datos
es particularmente adecuado para tratar con las agregados. Pero también se pueden utilizar datos
gramo
probabilidades.PAGrepresentar proporciones que ratan lahagregados; er que probabilidades. Sin embargo, para
posibilidad de encontrar una relación significativa entre obtener la mejor accesibilidad y número de viajes, utilice
norte
los datos, ya que conserva la máxima cantidad de varia la ce desagregada. Para modelar frecuencias de viaje más
norte
(1997) propone el uso de una estructura jerárquica (Figuratu

altas, Daly representa un número indefinido de opciones
4.12).
0 1+
1 2+
2 3+
etc.
Figura 4.12'Deja de ir ' modelo de generación de viajes
En cada nivel jerárquico, la elección es el número r para hacer más viajes o detenerse en el presente
(de ahí el nombre de 'modelo stop-go'). Beca entre la tuDebido a la posible gran diferencia en el comportamiento, se
opción 0/1+ y la opción choi restante usando un Cha encontrado que es preferible modelar el primero, ya que a
modelo separado. Sin embargo, debido a los múltiplesmenudo hay pocos datos sobre los viajeros que hacen
viajes, también es necesario modelar th (es decir, que mi
opciones restantes con un solo modelo 'stop-go'
predice la misma probabilidad de parar). en cada nivel de la jerarquía).
Se ha encontrado que la aplicación de este mim es sencillo. Si la probabilidad de hacer
modelo syst cualquier viaje espag(del modelo 0/1+)miprobabilidad de elegir la opción 'ir' en cada uno de
y la siguiente etapa esq(del modelo stop-go), th los números esperados de viajes es simplemente:
t=pag/ (1 -q)
El método ha sido aplicado en varios estudios en Europa (Daly 1997), obteniendo coeficientes para los diferentes
variables de accesibilidad que van desde 0,07 a 0,33 f opropósitos de viaje. Una versión más agregada sirvió en una
del modelo, utilizando regresión lineal sobre viajes obsencuesta de intercepción de la mayoría de los caminos hacia el
Norte de Chile, también dio buenos resultados arrojando medidas de accesibilidad (del tipo log-sum) con
coeficientes significativos del signo y magnitud propios (Iglesiaset al.2008).
4.6 Variables de pronóstico en el análisis de generación de viajes

La elección de las variables utilizadas para predecir las tasas de generación de viajes (domésticos) ha sido durante mucho tiempo
un área de preocupación para los planificadores de transporte; estas variables suelen incluir el número de hogares, el tamaño (y/o
la estructura) del hogar, el número de vehículos propios y los ingresos. Sin embargo, a principios de la década de 1980 surgió el
interés por investigaciones destinadas a enriquecer los modelos de generación de viajes con teorías y métodos de las ciencias del
comportamiento. La principal hipótesis detrás de este trabajo fue que las circunstancias sociales en las que viven los individuos
deberían tener una influencia considerable en las oportunidades y limitaciones que enfrentan al elegir actividades; esto último, a su
vez, puede dar lugar a comportamientos de viaje diferentes. Por ejemplo, es claro que el hecho de que una persona viva sola o no
debería afectar las oportunidades de coordinar y compensar actividades con otros para satisfacer sus necesidades de viaje. Por lo
tanto, una pareja casada con niños pequeños en edad preescolar generalmente tendrá menos movilidad que una pareja similar sin
hijos o con hijos mayores que requieren cuidados menos intensivos. Es probable que las personas mayores y jubiladas que viven
con adultos más jóvenes sean más activas fuera del hogar que las personas mayores que viven solas o con personas de su misma
edad.
A nivel del hogar, la situación es bastante similar: los hogares de personas no emparentadas, por ejemplo,
tienden a seguir un patrón de actividades que está menos influenciado por la presencia de otros miembros del
hogar (y que normalmente conduce a viajes más frecuentes) que en el caso de hogares de personas
emparentadas (obviamente de similar tamaño, y otras características). Esto se debe a la menor coordinación
entre los diferentes miembros y también al hecho de que sus patrones de actividad suelen implicar menos
actividades centradas en el hogar.
Una forma de introducir estas nociones en el modelado de la generación de viajes es desarrollar un conjunto de tipos
de hogares que capte efectivamente estas distinciones y luego agregar esta medida a las ecuaciones que predicen el
comportamiento de los hogares. Un enfoque posible considera la estructura de edad del hogar y su estilo de vida. El
enfoque es consistente con la idea de que viajar es undemanda derivaday que el comportamiento de viaje es parte de
una mayor asignación de tiempo y dinero a actividades en lugares separados. Por ejemplo, el concepto deestilo de vidase
puede hacer operativo como la asignación de cantidades variables de tiempo a diferentes propósitos (actividades) tanto
dentro como fuera del hogar, donde el viaje es solo parte de esta asignación de tiempo (ver Allamany otros. mil
novecientos ochenta y dos). Parece que la distribución del tiempo de los individuos varía sistemáticamente entre varios
segmentos de la población, como la edad, el sexo, el estado civil e incluso la raza; esto puede deberse a que las diferentes
estructuras del hogar imponen diferentes demandas a los individuos.
Un conjunto de hipótesis que se puede probar empíricamente es si los principales puntos de ruptura (o etapas) en el ciclo de
vida (o familia) son consistentes con cambios importantes en la distribución del tiempo. Por ejemplo, los puntos de ruptura pueden
ser:
- la aparición de niños en edad preescolar;

- el momento en que el hijo menor alcanza la edad escolar;
- el momento en que un joven se va de casa y vive solo, con otros jóvenes adultos, o se casa;
- el momento en que todos los hijos de una pareja se han ido de casa pero la pareja aún no se ha jubilado; el
- momento en que todos los miembros de un hogar han alcanzado la edad de jubilación.
Por lo general, es esclarecedor comparar los hogares en una etapa de este ciclo de vida con los hogares de la etapa
inmediatamente anterior.
Los conceptos de estilo de vida y etapa del ciclo familiar son importantes desde dos puntos de vista: primero, el de identificar
agrupaciones estables (en función de la edad o el sexo) con diferentes horarios de actividad y, en consecuencia,
demandas de viaje; segundo, el de permitir el seguimiento de cambios sistemáticos que pueden estar basados en variaciones
demográficas (por ejemplo, cambios en la estructura de edad, estado civil o laboral). Numerosas tendencias demográficas de
importancia en términos de comportamiento de viaje han recibido una atención creciente desde principios de la década de 1980
(ver Spielbergy otros. 1981). Uno de los más significativos para predecir el comportamiento de los viajes es la proporción cambiante
de hogares por población, particularmente en las naciones industrializadas. Si bien la tasa de crecimiento de la población ha ido
disminuyendo constantemente desde la década de 1980, la tasa de formación de hogares ha aumentado en algunos casos. Esto se
debe, entre otras razones, al aumento del número de hogares monoparentales y del número de personas que están constituyendo
hogares individuales. Por lo tanto, las metodologías de pronóstico de viajes que asumen implícitamente proporciones estables de
hogares por población (como suele ser el caso) se verán gravemente afectadas por este cambio estructural en la composición
demográfica de la sociedad.
Otra tendencia que ha sido bien discutida es el envejecimiento general de la población, particularmente en las naciones
industrializadas. Esto es importante porque la edad tiende a asociarse con una disminución de la movilidad y un cambio en el estilo
de vida. Sin embargo, es interesante notar que las diferencias en la generación de viajes por edad pueden reflejar en parte el
llamadoefectos de cohorte. Esto significa que las personas mayores pueden viajar menos, simplemente porque siempre lo han
hecho, y no por su edad. Sin embargo, este efecto puede ser mayor para las personas mayores de 65 años y la disminución de las
tasas de generación de viajes para otros grupos de edad probablemente refleje una verdadera disminución en la propensión a
viajar.
Finalmente, otra tendencia a destacar es el aumento en la proporción de mujeres que se incorporan a la fuerza
laboral. Su importancia para la planificación y previsión del transporte se deriva de dos efectos. El primero es
simplemente el efecto de empleo directo, donde la distribución del tiempo y, en consecuencia, el comportamiento de
viaje están profundamente influenciados por los requisitos para estar realmente empleado. El segundo es más sutil y se
refiere a los cambios en los roles del hogar y sus impactos en el estilo de vida, en particular para las parejas con hijos.
Para finalizar esta sección, es interesante mencionar que las ideas discutidas anteriormente dieron lugar a una
propuesta para incorporar una variable de estructura del hogar en el modelado de generación de viajes, que se probó
con datos reales (Allaman,y otros. mil novecientos ochenta y dos). Las categorías de estructura del hogar propuestas se
basaron en la edad, el sexo, el estado civil y el apellido de cada miembro del hogar. Estas variables permitieron
determinar la presencia o ausencia de dependientes en el hogar, el número y tipo de adultos presentes y la relación entre
los miembros del hogar. Sin embargo, aunque los modelos que utilizan esta variable se pronunciaron como una mejora
considerable sobre la práctica tradicional de Allamany otros. (1982), pruebas posteriores con un conjunto de datos
diferente realizadas por McDonald y Stopher (1983) llevaron a su rechazo. Esto se basó no solo en la evidencia estadística,
sino también en la sensibilidad de las políticas (es decir, es difícil utilizar la estructura del hogar como una variable de
política) y la facilidad de los motivos de pronóstico (es decir, pronósticos a nivel de zona, particularmente para obtener
una distribución de hogares por hogar). categoría de estructura, parece ser muy problemático). McDonald y Stopher
(1983) argumentan que, en estos dos sentidos, debería preferirse una variable del tipo de vivienda y seguramente será
más fácil de usar por una agencia de planificación del gobierno local.
4.7 Estabilidad y Actualización de Parámetros de Generación de Viajes

4.7.1 Estabilidad Temporal
Los modelos de transporte, en general, se desarrollan para ayudar en la formulación y evaluación de planes y proyectos
de transporte. Aunque en muchas ocasiones se ha hecho uso de estadísticas descriptivas para examinar las tendencias de
los viajes, la mayoría de los desarrollos han utilizado datos transversales para expresar la cantidad de viajes en términos
de factores explicativos; estos factores deben ser plausibles y fáciles de pronosticar para que el modelo sea sensible a las
políticas en el año de diseño. Una suposición clave (a menudo implícita) de este enfoque es que los parámetros del
modelo permanecerán constantes (o estables) entre los años base y de diseño.
Varios estudios han examinado esta suposición en un contexto de generación de viajes, encontrando en general que
no se puede rechazar cuando los viajes por todos los modos se consideran juntos (ver Kannel y Heathington 1973; Smith
y Cleveland 1976), incluso en el caso de la zonal más bien cruda. -modelos basados (aunque
estos no se recomiendan de todos modos, por razones similares a las discutidas en la sección 4.2.2; ver Downes y Gyenes 1976). Sin
embargo, análisis posteriores reportaron resultados diferentes. Por ejemplo, Salóny otros. (1987) compararon las tasas de viaje
observadas y los coeficientes de regresión de los modelos ajustados a los datos de hogares recolectados para Santiago en 1977 y
1986, y los encontraron significativamente diferentes. Copley y Lowe (1981) informaron que, aunque las tasas de viaje en autobús
para ciertos tipos de categorías de hogares parecían razonablemente estables a lo largo del tiempo, las tasas de viaje en automóvil
parecían estar altamente correlacionadas con los cambios en los precios reales del combustible. Esto último tiene las siguientes
implicaciones potenciales:
1. Si existe una elasticidad distinta de cero entre las tasas de viajes en automóvil y los precios del combustible, la suposición habitual de tasas de viajes
constantes en un período de rápido aumento de los precios de la gasolina podría conducir a un grave exceso de provisión de servicios viales.
Si, por otro lado, los precios del combustible cayeran en términos reales, el supuesto de tasas constantes de viaje
conduciría a una provisión insuficiente (que es precisamente lo que se experimentó en el Reino Unido y otros países
industrializados a fines de la década de 1980).
2. Además, el equilibrio entre las inversiones futuras en instalaciones de transporte público y privado puede juzgarse
incorrectamente si se basa en el supuesto de tasas de viajes constantes a lo largo del tiempo.
Claramente entonces, la estimación correcta del efecto de los precios de los combustibles sobre las tasas de viaje (y de cualquier otro efecto
similar) longitudinalefectos) es de fundamental importancia para el análisis de políticas. Desafortunadamente, no se puede abordar con los
conjuntos de datos transversales típicamente disponibles para los estudios de transporte.
Otro factor que afecta la estabilidad de los modelos de generación de viajes a lo largo del tiempo es la evidencia
disponible sobre los cambios en el comportamiento de viaje. Cambiamos de opinión y el conjunto de actividades que nos
gustaría lograr no es fijo. Los programas de cambio de comportamiento tienen un efecto en la reducción de la cantidad
de viajes (a menudo combinándolos en recorridos más eficientes en un día diferente de la semana) y en la transferencia
de algunos de ellos a modos más amigables con el medio ambiente. Estas técnicas funcionan porque la persona se
beneficia al ahorrar el tiempo que dedica a viajar. Existe alguna evidencia de que incluso sin estas intervenciones, las
personas cambian su comportamiento de viaje en respuesta a un trabajo en el hogar más fácil y una mayor conciencia de
los problemas ambientales y de salud. La oportunidad de cambios parece ser más clara cuando se produce una
intervención importante en el sistema de transporte y actividad. Esto explicaría en parte, por ejemplo, el mayor cambio
de lo esperado hacia el transporte público cuando se introdujo por primera vez el cobro por congestión en Londres.
4.7.2 Estabilidad Geográfica
La estabilidad temporal a menudo es difícil de examinar porque se requieren datos (de calidad similar) para la misma
área en dos momentos diferentes. Por lo tanto, en muchas ocasiones puede ser más fácil examinar la estabilidad
geográfica (o la transferibilidad) ya que los datos de dos ubicaciones diferentes pueden estar disponibles (por ejemplo, si
dos instituciones ubicadas en diferentes áreas deciden realizar un proyecto de investigación conjunto). La transferibilidad
geográfica debe verse como un atributo importante de cualquier modelo de demanda de viajes por las siguientes
razones:
1. Sugeriría la existencia de ciertas regularidades repetibles en el comportamiento de viaje que el

modelo puede captar y reflejar.
2. Indicaría una mayor probabilidad de que también exista estabilidad temporal; esto, como vimos, es esencial para
cualquier modelo de pronóstico.
3. Puede permitir reducir sustancialmente la necesidad de costosas encuestas de transporte a gran escala en diferentes
áreas metropolitanas (ver la discusión en el Capítulo 9).
Es claro que no todas las características de viaje pueden ser transferibles entre diferentes áreas o ciudades; por
ejemplo, la duración promedio de un viaje de trabajo obviamente depende del contexto, es decir, debe ser un
función del tamaño del área, la forma y la distribución de los lugares de trabajo y las zonas residenciales en el espacio. Sin
embargo, la transferibilidad de las tasas de viaje no debe verse como poco realista: los viajes reflejan las necesidades de
participación de los individuos en diversas actividades fuera del hogar y si las tasas de viaje están relacionadas con grupos
homogéneos de personas, se puede esperar que se mantengan estables y transferibles geográficamente dentro del mismo
contexto cultural.
La transferibilidad de los modelos de generación de viajes (típicamente tasas de viaje en un marco de
análisis de categoría de hogar) se ha probado relativamente raramente, produciendo resultados
normalmente insatisfactorios (ver Caldwell y Demetski 1980; Daor 1981); los pocos ejemplos exitosos han
considerado solo una parte de los viajes, por ejemplo, los viajes realizados en automóvil (ver Ashley
1978). Por otro lado, Supernak (1979, 1981) reportó la transferibilidad exitosa del modelo de generación
de viajes de categoría personal, tanto para condiciones polacas como americanas. Finalmente, Rose y
Koppelman (1984) examinaron la transferibilidad de un modelo de generación de viajes de elección
discreta, que permite el ajuste de las constantes modales utilizando datos locales. Una de sus
conclusiones fue que la similitud del contexto parecía ser un determinante importante de la
transferibilidad del modelo; también,
4.7.3 Actualización Bayesiana de Parámetros de Generación de Viajes
Supongamos que queremos estimar un modelo de generación de viajes pero carecemos de fondos para recopilar datos de
encuestas apropiados; una solución posible (pero inadecuada) es usar un modelo estimado para otra área (con suerte similar)
directamente. Sin embargo, sería muy deseable modificarlo para reflejar las condiciones locales con mayor precisión.
Esto se puede hacer mediante técnicas bayesianas para actualizar los parámetros del modelo original utilizando
información de una pequeña muestra en el contexto de la aplicación. La actualización bayesiana considera unprevio
distribución (es decir, la de los parámetros originales a actualizar), nueva información (es decir, a obtener de la
pequeña muestra) y unaposteriordistribución correspondiente a los parámetros del modelo actualizado para el
nuevo contexto. Las técnicas de actualización son muy importantes en un marco de planificación continua; veremos
este tema aparecer en varias partes de este libro.
Considere, por ejemplo, el problema de actualizar las tasas de viaje por categorías de hogar; Siguiendo a
Mahmassani y Sinha (1981), emplearemos la notación de la tabla 4.8.
Tabla 4.8Notación de actualización bayesiana para la generación de viajes
Variable Informacion previa Nueva información
Tasa media de viaje t1 ts

Nº de observaciones norte1 nortes
Variación de la tasa de viaje S12 Ss2
La tasa media de viajes de una categoría (o celda) es, por supuesto, el promedio de una muestra de tasas de viajes de los hogares. De
acuerdo con laTeorema del límite central, si el número de observaciones en una celda es al menos 30, la distribución muestral de las tasas
de viajes (medias) de la celda puede considerarse distribuida como Normal, independientemente de la distribución de las tasas de viajes
de los hogares. Por lo tanto, la distribución previa de las tasas de disparo de la celda
para el modelo original es N(t1,S2 1/norte1), porquet1yS2 1/norte1son estimadores insesgados de su media y
diferencia. De manera similar, las celdas para la muestra pequeña (nueva información) pueden considerarse distribuidas
Normal con parámetrostsyS2 s/nortes.
El teorema de Bayes establece que si las distribuciones anterior y muestral son normales con varianzas conocidas
σ2, entonces la distribución posterior (actualizada) de las tasas medias de viaje también es Normal con el
siguientes parámetros:
1/ σ21 1/ σ2s
t2= t
2 1
+ t (4.21)
1/ σ12+1/ σs 1/ σ12+1/ σ2 segundos
s
1
σ22= (4.22)
1/ σ12+1/ σ2 s
que, sustituyendo por los valores conocidosS2ynorte, producir:
1ts
norte1S2 t1+nortesS2
s
t2= (4.23)
Ss2+norte
norte1 sS21
S2 2
1Ss
σ22= (4.24)
Ss2+nortesS21
norte1
Es importante recalcar que esta se distribuye a los on no es el de las tasas de viaje individuales de cada una
hogares en la celda correspondiente, pero se de las medias de las tasas de viaje de la celda. De hecho, la
desconoce la de distribución de las tasas individuales; única
t información que tenemos es que comparten el
misma media (posterior)t2.
Ejemplo 4.6La tasa media de viajes, su varianza a norted el número de observaciones para hace dos hogares se
categorías, obtenida en un estudio realizado 10 años muestra a continuación:
Categorías de hogar
Variable (datos previos) 1 2

Viajes por dia 8 5
Nº de observaciones sesenta y cinco 300
Variación de la tasa de viaje 64 15
Varianza media del viaje 0.98 0.05
Se cree que estos valores podrían estar ligeramente fuera de los fondos f fecha para uso directo hoy, pero no hay suficientes
para embarcarse en una encuesta a gran escala. Los valores pequeños se smuestras tratadas finalmente se toma, lo que produce el
muestran a continuación:
Variable (datos nuevos) 1 2

Viajes por dia 12 6
Nº de observaciones 30 30
Variación de la tasa de viaje 144 36
Varianza media del viaje 4.80 1.20
El lector puede verificar eso aplicando la ecuación s (4.23) y (4.24) es posible estimar la
siguiendo los valores y varianzas de la tasa de viaje:
(continuado)
Posterior 1 2
Tasa de viajes (viajes/día) 8.68 5.04
Diferencia 0.82 0.05
Ejercicios
4.1 Considere una zona con las siguientes características:
Tipo de hogar No. Ingreso ($/mes) habitantes Viajes/día
0 autos 180 4 000 4 6

1 coche 80 18 000 4 8
2 o más autos 40 50 000 6 11
Debido a una disminución en los aranceles de importación y un aumento del ingreso real del 30%, se espera que en
cinco años el 50% de los hogares sin automóvil adquiera uno. Estime cuántos viajes generaría la zona en ese caso;
compruebe si su método es verdaderamente el mejor disponible.
4.2 Considere los siguientes modelos de atracción de viajes estimados usando un paquete de computación estándar (t-las
proporciones se dan entre paréntesis);
Y=123.2 + 0.89X1 R2= 0.900

(5.2) (7.3)
Y= 40.1 + 0.14X2+ 0.61X3+ 0.25X4 R2= 0.925
(6.4) (1.9) (2.4) (1.8)
Y= −1.7 + 2.57X1− 1.78X4 R2= 0.996
(-0.6) (9.9) (−9.3)
dóndeYson viajes de trabajo atraídos por la zona,X1es el empleo total en la zona,X2es el

empleo industrial en la zona,X3es empleo comercial en la zona yX4es el empleo de servicios.
Elija el modelo más adecuado, explicando claramente por qué (es decir, teniendo en cuenta todos sus pros y sus contras).
4.3 Considere los siguientes dos modelos de generación de viajes de trabajo pico por la mañana, estimados por regresión lineal de
hogares:
y=0.50 + 2.0X1+ 1.5X2 R2= 0.589

(2.5) (6.9) (5.6)
y=0.01 + 2.3X1+ 1.1Z1+ 4.1Z2 R2= 0.601
(0.9) (4.6) (1.9) (3.4)
dóndeyson viajes domésticos al trabajo en el pico de la mañana,X1es el número de trabajadores en el

hogar,X2es el número de coches en el hogar,Z1es una variable ficticia que toma el valor de 1 si el
hogar tiene un automóvil yZ2es una dummy que toma el valor de 1 si el hogar tiene dos o más
automóviles.
(a) Elija uno de los modelos que explique claramente el razonamiento detrás de su decisión.
(b) Representar gráficamente ambos modelos usando el eje apropiado.
(c) Si una zona tiene 1000 hogares (con un promedio de dos trabajadores por hogar), de los cuales el 50% no tiene
automóvil, el 35% tiene un solo automóvil y el resto exactamente dos automóviles, estime el número total de
viajes generados por la zona,Oi, con ambos modelos. Discuta sus resultados.
4.4 La siguiente tabla presenta los datos recolectados en la última encuesta de hogares O–D (realizada hace diez años)
para tres zonas en particular:
Zona Residentes/HH Trabajadores/HH Ingreso medio Población
I 2.0 1.0 50 000 20 000

Yo 3.0 2.0 70 000 60 000
tercero 2.5 2.0 100 000 100 000
Hace diez años se estimaron dos modelos de generación de viajes basados en el hogar utilizando estos datos. El primero
fue un modelo de regresión lineal dado por:
y=0.2 + 0.5X1+ 1.1Z1 R2= 0.78

dóndeyson viajes domésticos en horas pico,X1es el número de trabajadores en el hogar yZ1es una
variable ficticia que toma el valor de 1 para ingresos altos (>70 000) hogares y 0 en los demás casos.
El segundo fue un modelo de análisis de categorías basado en dos estratos de ingresos (ingresos bajos y altos) y
dos niveles de estructura familiar (1 o menos y 2 o más trabajadores por hogar). Las tarifas de viaje estimadas se
dan en la siguiente tabla:
Ingreso
Estructura familiar Bajo Alto
1 o menos 0.8 1.0

2 o más 1.2 2.3
Si el total de viajes generados hoy en hora punta por las tres zonas viene dado por:
Zona viajes en horas pico
I 8 200
Yo 24 300
tercero 92 500
y se estima que las características de la zona (ingresos, número de hogares y estructura familiar) se han
mantenido estables, decidir cuál es el mejor modelo. Explica tu respuesta.

ModellingTransport-161-195 en Es

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

ModellingTransport-161-195 en Es

Uploaded by

Copyright:

Available Formats

Traducido del inglés al español - www.onlinedoctranslator.

Transporte de modelado, Cuarta edición. Juan de Dios Ortúzar y Luis G. Willumsen. ©

Producción de viajesEsto se define como ip

Figura 4.1Viajes producciones y atracciones

4.1.2 Caracterización de los viajes

- Viajar para trabajar;

4.1.2.2 Por hora del día

Tabla 4.1 Ejemplo de clasificación de viaje

pico de la mañana Fuera de pico

Objetivo No. % No. %

Trabajar 465 683 52.12 39 787 12.68

4.1.2.3 Por tipo de persona

4.1.3 Factores que afectan la generación de viajes

4.1.3.1 Producciones de viajes personales

4.1.3.2 Atracciones personales del viaje

4.1.3.3 Producciones y atracciones de viajes de carga

4.1.4 Modelado de factores de crecimiento

dóndeTiytison respectivamente viajes futuros y actuales en la zonai, yFies un factor de crecimiento.

Hogares con coche producen: Hogares sin coche

ti=250×2.5 + 250×6.0 = 2125 viajes/día

Fi=Cd i/CC i=1/0.5 = 2

Ti=2×2125 = 4250 viajes/día

4.2 Análisis de regresión

4.2.1 El modelo de regresión lineal

mi(Yi) =a+bXi (4.3)

Figura 4.2Distribuciones generales deYdadoX

Figura 4.3Distribución deYasumido en regresión lineal

Figura 4.4Líneas de regresión verdaderas y estimadas

Es importante distinguir entre los erroresmii, que no se conocen y pertenecen a la verdadera

mi(a) =a Var(a) =σ2/norte

De paso, la fórmula de la varianza debtiene implicaciones interesantes en términos de diseño experimental.

4.2.1.3 Pruebas de hipótesis para b̂

Elt-pruebaUna hipótesis nula típica es H0:b=0; en este caso (4.8) se reduce a:

Figura 4.6Región de rechazo paraα= 5%

Figura 4.7b; es decir, aceptando que cada p t

4.2.1.4 El Coeficiente de Determinación R2

Figura 4.8Desviaciones explicadas y no explicadas

(Yi−Y) = (Ŷi−Y) + (Yi−Ŷi), ∀i

4.2.1.5 Regresión múltiple

R2= [R2−k/(norte−1)][(norte−1)/(norte−k−1)] (4.12)

dóndenorterepresenta el tamaño de la muestra como antes ykes el número de regresoresb.

{RSSR − RSStu} (norte−k)

4.2.2 Regresión múltiple basada en zonas

mientras que el modelo utilizando tasas sería:

conyi=Yi/Hi;Xi=Xi/Hi;mii=mii/HiyHiel número de hogares en la zonai.

Cuadro 4.2Variación interzonal de producciones personales para dos

Valor medio de interzonal

75 zonas pequeñas 8.13 5.85

4.2.3 Regresión basada en el hogar

- modelos más caros en términos de recolección de datos, calibración y operación;

Cuadro 4.3 Ejemplo de regresión por pasos

Tabla 4.4 Comparación de viajes por hogar (observados/estimados).

Número de trabajadores en el hogar

0 0,9/0,9 2.1/2.4 3.4/3.8 5.3/5.6

4.2.4 El problema de la no linealidad

Figura 4.9Un ejemplo de no linealidad

Y=0.84 + 1.41X1+ 0.75Z1+ 3.14Z2 R2= 0.387

Figura 4.10Modelo de regresión con variables ficticias

4.2.5 Obtención de Totales Zonales

dóndeTies el número total de viajes HB en la zonai,Hies el número total de hogares en él yXJies el

Ti=Hi(0.84 + 1.41X1i) +0.75H1i+3.14H2i

dóndeHJies el número de hogares de clasejen la zonai.

4.2.6 Coincidencia de generaciones y atracciones