You are on page 1of 389
Editor: Audy Salcedo CARACAS ‐ 2013 Vicerrectorado Académico
Editor:
Audy Salcedo
CARACAS ‐ 2013
Vicerrectorado
Académico

Educación Estadística en América Latina

Tendencias y Perspectivas

Educación Estadística en América Latina Tendencias y Perspectivas
Educación Estadística en América Latina Tendencias y Perspectivas
Educación Estadística en América Latina Tendencias y Perspectivas
Educación Estadística en América Latina Tendencias y Perspectivas

Editor: Audy Salcedo

Comité Académico: Lisbeth K. Cordani Cileda de Queiroz e Silva Coutinho Santiago Inzunsa Cazares Audy Salcedo (Coordinador)

Los artículos fueron seleccionados mediante sistema de arbitraje.

Educación Estadística en América Latina: Tendencias y Perspectivas.

Octubre 2013

ISBN: 978-980-00-2744-8

Depósito Legal: Ifi17520135102435

Diseño de Portada: Antonio Machado E.

Foto de portada: Vanessa I. Valdes V. (Estudiante Comunicación Social – UCV)

vanessavaldesv@hotmail.com

Diseño y diagramación: Audy Salcedo

Publicado por:

Programa de Cooperación Interfacultades Vicerrectorado Académico Universidad Central de Venezuela Av. Carlos Raúl Villanueva Instituto de Investigaciones Económicas y Sociales Rodolfo Quintero, piso 1, Ofic. 203. UCV. Teléfonos: +58 212 605 – 2597 http://www.ucv.ve/portal-pci.html E-mail: pciucv@ucv.ve; pciucv@gmail.com

AUTORIDADES DE LA UNIVERSIDAD CENTRAL DE VENEZUELA

Dra. Cecilia García Arocha, Rectora

Dr. Nicolás Bianco C., Vicerrector Académico

Dr. Bernardo Méndez, Vicerrector Administrativo

Dr. Amalio Belmonte, Secretario

Índice

Presentación

7

Capítulo 1:

Simulación y modelos en la enseñanza de la probabilidad: un análisis del potencial de los applets y la hoja de cálculo.

Santiago Inzunza Cazares

9

Capítulo 2:

Efecto de los formatos y el tipo de información en la resolución de problemas de probabilidad condicional.

Gabriel Yañez Canal, Ana Rátiva Hernández y

Diana Lozano Rodríguez

31

Capítulo 3:

La utilización del razonamiento deductivo en eventos mutuamente excluyentes y eventos independientes.

Adriana G. D´Amelio

57

Capítulo 4:

La búsqueda del espacio muestral ‘original’: una necesidad para la enseñanza.

Felipe Fernández, Luisa Andrade y Benjamín Sarmiento

81

Capítulo 5:

Profesorado de estadística en América latina: necesidad de su caracterización desde la perspectiva social, pedagógica y disciplinar.

Jesús Humberto Cuevas Acosta y Greivin Ramírez Arce

99

Capítulo 6:

El conocimiento didáctico del contenido estadístico del maestro.

Julia Elena Sanoja y José Ortiz Buitrago

125

Capítulo 7:

La clase de estadística más allá del curriculo.

Lucia Zapata-Cardona y Pedro G. Rocha

153

Capítulo 8:

Estudio de clases para el mejoramiento de la enseñanza de la estadística en Chile.

Soledad Estrella y Raimundo Olfos

167

Capítulo 9:

Introdução ao conceito de probabilidade e os livros didáticos para Ensino Médio no Brasil.

Cileda de Queiroz e Silva Coutinho

193

Capítulo 10:

La estadística y la propuesta de un currículo por competencias.

Ernesto A. Sánchez Sánchez y Verónica Hoyos

211

Capítulo 11:

O desenvolvimento profissional de professores em educação estatística nas pesquisas brasileiras.

Celi Espasandin Lopes

229

Capítulo 12:

Uma primeira aproximação na avaliação dos cursos de graduação e pós graduação em estatística em universidades de São Paulo.

Ana Aparicio, Oscar João Abdounur y Jorge Luis Bazán

257

Capítulo 13:

Uso de estatística na opinião de egressos de licenciatura em matemática de uma universidade pública.

Capítulo 14:

Uso de software, grupos, proyectos y presentaciones, para enseñar y fomentar la estadística aplicada.

 

Jorge Luis Romeu

299

Capítulo 15:

Didáctica de la estadística en la educación superior.

Hugo Alvarado Martínez

319

Capítulo 16:

Educación estadística en cursos introductorios a nivel universitario:

algunas reflexiones.

Roberto Behar, Pere Grima Cintas, Mario Miguel Ojeda Ramírez y

Cecilia Cruz López

343

Capítulo 17:

La estimación de la correlación: variables de tarea y sesgos de razonamiento.

María M. Gea, Carmen Batanero, Gustavo R. Cañadas,

Pedro Arteaga y José M. Contreras

361

Presentación

El año 2013 se fue declarado como el Año Internacional de la Estadística (International Year of Statistics – Statistics 2013), con el propósito de celebrar y reconocer los aportes de la Estadística al quehacer diario en la sociedad actual. Los objetivos que se persiguen son:

  • Aumentar la conciencia pública sobre el poder y el impacto de la Estadística en todos los aspectos de nuestra sociedad.

  • Promover la Estadística como una profesión, especialmente entre la gente joven.

  • Fomentar la creatividad y Estadística.

el

desarrollo de las

ciencias de

la Probabilidad y

la

Como parte de la celebración de este Año Internacional de la Estadística (Estadística 2013), en la Universidad Central de Venezuela, a través del Programa de Cooperación Interfacultades, decidimos publicar dos libros, en formato electrónico: La Estadística en la Investigación:

competencia transversal en la formación universitaria y Educación Estadística en América Latina: Tendencias y Perspectivas.

Este volumen, Educación Estadística en América Latina: Tendencias y Perspectivas, reúne trabajos de investigadores oriundos de distintos países latinoamericanos, se trata de una muestra incompleta de nuestra región. Pero también se encuentran presentes investigadores de España, en un caso, formando equipo con investigadores latinoamericanos y en otro como grupo; como es el caso del Grupo de Investigación sobre Educación Estadística de la Universidad de Granada; el cual, sin duda, tiene gran influencia en América Latina. Los trabajos aquí publicados tienen en común su preocupación por la enseñanza, aprendizaje y evaluación de la Estadística en distintos niveles de la educación. Con esta obra se busca dar evidencia del desarrollo de la Educación Estadística en Latinoamérica.

Queremos dar las gracias a todos los investigadores que enviaron sus trabajos para ser considerados en esta publicación, incluyendo aquellos que no fueron seleccionados. Asimismo, agradecemos a los miembros del Comité Académico, por sus recomendaciones y orientaciones para la selección de los trabajos y los árbitros. Por último, queremos expresar nuestro infinito agradecimiento a todos los investigadores que, de forma desinteresada, revisaron todos los trabajos preseleccionados. La labor realizada por todo este grupo de personas permitió la evaluación y selección de los trabajos que conforma esta obra.

Audy Salcedo Coordinador Ejecutivo Programa de Cooperación Interfacultades Octubre 2013

CAPÍTULO 1

SIMULACIÓN Y MODELOS EN LA ENSEÑANZA DE LA PROBABILIDAD: UN ANÁLISIS DEL POTENCIAL DE LOS APPLETS Y LA HOJA DE CÁLCULO

SANTIAGO INZUNSA CAZARES

RESUMEN

En el presente capítulo hacemos un análisis del potencial de la simulación y la construcción de modelos en la enseñanza y aprendizaje de la probabilidad. Con base en la revisión de la literatura identificamos diversas ventajas y dificultades que se han observado después de su implementación por medio de diversas herramientas computacionales. Hacemos énfasis en dos herramientas de software como son la hoja de cálculo y los applets, y presentamos algunos resultados de un trabajo de investigación sobre modelación con la hoja de cálculo Excel que realizamos con estudiantes en un curso universitario a nivel introductorio.

Palabras clave: Simulación, probabilidad, applets, hojas de cálculo.

1. INTRODUCCION

El enfoque de modelación para la resolución de problemas ha venido adquiriendo cada vez mayor importancia; de tal forma, las prácticas de modelación que involucran situaciones de la vida real son cada vez más frecuentes en la enseñanza y aprendizaje de diversas áreas de las matemáticas. Romberg, Carpenter y Kwako (2005) señalan que la modelación puede ayudar a los estudiantes a desarrollar una comprensión de un amplio rango de importantes ideas matemáticas y de otras ciencias, por lo que las prácticas de modelación deberían ser fomentadas en cada nivel educativo. Goldstein y Hall (2007) consideran que con el planteamiento de situaciones de modelación se busca estimular el interés de los estudiantes por problemas del mundo real, y de esta manera, generar un aprendizaje más significativo y una adecuada comprensión de diversos conceptos matemáticos. Por su parte, English y Sriraman (2010) identifican en el enfoque de modelación diversas ventajas didácticas, entra las cuales destacan las siguientes:

1. Las cantidades y operaciones que son necesarias para matematizar situaciones reales, con frecuencia van más allá de las que son enseñadas en el currículo tradicional de matemáticas. Ejemplos de estas cantidades son: acumulaciones, probabilidades, frecuencias, rangos y vectores; mientras que las operaciones necesarias incluy en, ordenamientos, selección, cuantificación y transformación de conjuntos de datos.

  • 2. El ambiente de modelación ofrece ricas experiencias de aprendizaje que no se encuentran fácilmente en la enseñanza tradicional, ya que los estudiantes requieren generar sus propias ideas matemáticas conforme resuelven el problema, lo que exige a su vez, que tomen sentido de él para poder matematizarlo.

  • 3. En la modelación se pueden utilizar contextos del mundo real extraídos de diversas disciplinas (transversalidad), con lo cual los estudiantes pueden comprender el verdadero valor de las matemáticas en las ciencias y vida cotidiana.

  • 4. Mediante prácticas de modelación de mayor alcance se puede estimular el desarrollo de modelos

generalizables que son aplicables a un amplio rango de situaciones relacionadas. En el caso particular de la probabilidad -campo de estudio que se aborda en el presente trabajo-, la importancia de los modelos ha sido señalada por diversos autores y organismos que promueven la enseñanza de la probabilidad (Heitele, 1975; Borovcnik, Bentz y Kapadia, 1991; NCTM, 2000; Sánchez y Canal, 2003). Por ejemplo, Heitele (1975) identifica al modelo de urna y simulación como una de varias ideas estocásticas fundamentales que deben ser abordadas de forma continua y con diferentes niveles cognitivos y de formalidad a lo largo de un currículo en espiral, que empieza desde la educación elemental. A través de modelos de urna es posible representar una diversidad de experimentos aleatorios – sobre todo aquellos con espacios muestrales contables- mediante los cuales los estudiantes pueden construir modelos explicativos intuitivos correctos de diversos conceptos de probabilidad desde edades tempranas, ya que son relativamente sencillos y para su elaboración no se requiere una enseñanza formal y analítica, ya sea en forma física o en ambientes virtuales. Además, diversos experimentos aleatorios pueden ser analizados mediante la composición o secuencia de varias urnas (hiperurna), lo que permite estudiar procesos aleatorios de mayor complejidad como los que se establecen en el currículo de probabilidad en grados superiores.

2. MODELOS Y SIMULACION COMPUTACIONAL

Gottfried (1984) considera a la simulación como una actividad mediante la cual se pueden extraer conclusiones acerca del comportamiento de un sistema, estudiando el comportamiento de un modelo cuyas relaciones de causa y efecto son las mismas (o similares) a las del sistema original. En nuestro caso nos interesamos en un tipo particular de simulación, como es la simulación aleatoria, en la cual el sistema contiene variables con elementos de incertidumbre (variables aleatorias). Las situaciones aleatorias de interés en la clase de probabilidad pueden ser representadas mediante modelos matemáticos, modelos físicos (por ejemplo: urnas o ruletas) o modelos computacionales. Según Biehler (1991) los modelos computacionales tienen una naturaleza dual, ya que son a su vez

10-

modelos simbólicos como los modelos matemáticos (representados en lenguaje formal) y al mismo tiempo son modelos físicos (representados en una máquina real). Señala a su vez que “los modelos computacionales son más cercanos a las características hipotéticas y exploratorias de la modelación matemática tradicional que de los modelos físicos” (p. 173). En didáctica de la probabilidad el interés se ha centrado en el uso de modelos computacionales para simular sistemas o situaciones aleatorias, el modelo matemático de la situación puede ser representado mediante un lenguaje de computadora y tiene como base primitiva al comando random. De esta manera, con el avance de la tecnología y los ambientes virtuales con interfaces altamente interactivas que hoy existen, la simulación computacional permite explorar la potencialidad de los diferentes tipos de modelos (matemático, computacional y físico) de forma simultánea, ya que cuando se construye el modelo se utilizan argumentos, símbolos y razonamiento matemático, el cual se convierte en alguna medida, –dependiendo del software utilizado- en un modelo físico virtual o en un modelo computacional más formal. Así, la introducción de la probabilidad a través de modelos puede realizarse a distintos niveles de abstracción y formalismo como lo sugiere Heitele (1975). Chaput, Girard y Henry (2008) consideran que algunos modelos básicos pueden ser presentados usando terminología de la vida diaria. Los objetos son idealizados mediante la selección de sus características más relevantes y de esta manera se obtiene un modelo pseudo-concreto de la realidad. Un ejemplo muy ilustrativo es el modelo de urna: en un primer momento se puede presentar una urna real conteniendo canicas (indistinguibles al tacto), la cual puede ser representada por una urna ideal con un modelo probabilístico basado en la hipótesis de equiprobabilidad en la selección aleatoria de las canicas (distribución de probabilidad uniforme). A mayor nivel de formalidad y abstracción, es necesario utilizar representaciones, lenguaje y simbolismo matemático para construir un modelo (por ejemplo, el modelo Bernoulli) que describa las propiedades generales del modelo de urna y los algoritmos con los cuales se pueden realizar operaciones sobre el modelo. Para contextualizar lo anterior consideremos la siguiente situación: En una población el 42.8% de los habitantes se opone a una ley que está orientada a cobrar más impuestos, el resto de los habitantes (57.2%) está de acuerdo con dicha ley; si se selecciona una muestra aleatoria de 5 personas, ¿cuál es la probabilidad de que todas estén de acuerdo con la nueva ley? Una idealización del problema nos permite establecer como características e hipótesis relevantes, las dos posibles respuestas (acuerdo o descuerdo) que se pueden obtener al plantear la pregunta a una persona, las cuales se consideran independientes y con probabilidades constantes cada vez que se realice la entrevista a una persona. Es posible entonces, diseñar una urna real con 7 canicas de dos colores, donde un color (por ejemplo, verde) representa a las personas que están de acuerdo (42.8%) y el otro color (por ejemplo, rojo) a los

que están en desacuerdo (57.2%). Se deben colocar entonces 4 canicas rojas y 3 canicas verdes para representar los porcentajes indicados en el enunciado del problema. Se debe establecer además que se seleccionará con reemplazo una canica (para mantener constante la probabilidad y cumplir la independencia), se observa su color y se anota el resultado. Además del modelo físico anterior se puede generar un modelo pseudo-concreto virtual a través de un programa de computadora considerando las mismas condiciones ya especificadas. En este caso utilizaremos el software SimulaProb (Gastélum y Inzunsa, 2007). El software tiene en su diseño incorporada la hipótesis de otorgar la misma probabilidad a cada canica que sea seleccionada, por lo que la selección parte de una distribución de probabilidad uniforme (ver figura 1). Al definir los elementos y condiciones establecidos en el software, los estudiantes están realizando una traducción del problema real al contexto computacional y el modelo generado debe reproducir los mismos resultados que si el experimento se realiza con la urna real. A un nivel más abstracto, se pueden poner en correspondencia los resultados obtenidos físicamente y con la computadora, con el modelo matemático que correspondiente, que es la distribución de probabilidad binomial con parámetros n=5 y

p=0.572.

que están en desacuerdo (57.2%). Se deben colocar entonces 4 canicas rojas y 3 canicas verdes

Fig. 1: Ventana de diseño para la definición de un modelo de urna en el software SimulaProb.

3. EL POTENCIAL DE LA SIMULACIÓN Y LA CONSTRUCCIÓN DE MODELOS

Biehler (1991) señala dos aspectos de la enseñanza de la probabilidad en los que la simulación computacional con una metodología pedagógica apropiada puede ser de gran apoyo. Estos son la “carencia de experiencia” y lo que él llama “puente concepto-herramienta”. Respecto a la carencia de experiencia, señala que las computadoras pueden proporcionar mucho más experiencia en el manejo y representación de los datos a como sería posible en forma manual en el mismo período de tiempo. Por lo que se refiere al puente concepto-herramienta, indica que muchos problemas de matemáticas dependen tradicionalmente de la capacidad de cálculo de los estudiantes. Así, la computadora

12-

proporciona a través de la simulación una estrategia alternativa para la resolución de problemas y nos

permite investigar situaciones más realistas que antes no eran posibles. Señala a su vez, los siguientes aspectos que él considera ventajosos con el enfoque computacional.

  • 1. El número de repeticiones es fácilmente incrementado, haciendo que la incertidumbre y la variabilidad de los resultados se reduzcan; nuevas clases de patrones pueden ser detectados.

  • 2. Es posible una exploración extensiva cambiando los supuestos del modelo, haciendo experimentos adicionales, cambiando la forma de generar los datos, etc.

  • 3. Representaciones nuevas y más flexibles están disponibles para expresar modelos y procesos estocásticos y despliegue de datos con facilidades gráficas.

Otro aspecto interesante señalado por Biehler tiene que ver con el potencial experimental e interactivo de las computadoras. Al respecto, Thistead y Velleman (1992), describen a la simulación “como la cara experimental de la ciencia del análisis de datos. En el salón de clase la simulación de experimentos juega el mismo rol para la estadística, como el laboratorio de experimentos lo hace para muchas ciencias. El profesor puede usar simulaciones para ilustrar principios o procedimientos, para demostrar hechos y métodos” (p. 45). Por su parte, Batanero (2001), resalta la importancia de la simulación como recurso didáctico, ya que puede ayudar a comprender la diferencia entre modelo y realidad y a mejorar las intuiciones sobre la aleatoriedad. Desde nuestra perspectiva, la simulación computacional, integra diversos aspectos que son importantes en la enseñanza de la probabilidad:

  • 1. Requiere de una actividad de modelización matemática en la cual los estudiantes necesitan desarrollar ciertas competencias, tales como hacer supuestos para simplificar el problema, identificar y simbolizar variables y parámetros, formular el modelo tomando en cuenta los supuestos y las condiciones del problema, para finalmente resolverlo e interpretar la solución.

  • 2. Cuando es posible una solución analítica del problema, se pueden contrastar los resultados experimentales generados por la simulación con los resultados teóricos. En casos donde no es posible una solución analítica o es demasiado compleja, la simulación constituye una herramienta de fundamental importancia.

  • 3. Permite abordar problemas abstractos en términos más concretos, sobre todo cuando la simulación se realiza en ambientes computacionales provistos de diversas representaciones (gráficas, simbólicas, numéricas) ligadas entre sí, que hacen posible una visualización y retroalimentación de las diversas componentes del modelo.

El fundamento de la simulación de fenómenos aleatorios está basado en la concepción frecuencial de la probabilidad, que considera ésta como el número al que tiende la frecuencia relativa de un evento al repetir indefinidamente un experimento aleatorio, y avalada teóricamente por la ley de los grandes

números. Hay que tener en cuenta sin embargo que el uso de este enfoque permite encontrar una solución aproximada del problema y no proporciona la justificación del porqué esa solución es correcta. Será necesario un estudio matemático formal de la distribución de resultados para probar de manera definitiva cuál es la solución correcta.

4. LA SIMULACIÓN EN EL CURRÍCULO DE PROBABILIDAD

Algunas reflexiones y discusiones sobre el potencial de la simulación en la enseñanza de la probabilidad datan desde la década de los años 70 y 80 de siglo pasado. Biehler (1991) en su artículo “Computadoras en la Enseñanza de la Probabilidad”, el cual ha sido referente para muchos trabajos de investigación actuales, realiza un recuento de la investigación realizada hasta la fecha y encuentra que más allá del optimismo que generó la introducción de la tecnología, existía poca evidencia empírica sobre el uso de simulaciones en la enseñanza de la probabilidad. Entre las causas que atribuye a la escasez de resultados de investigación por la época, menciona la reciente incorporación de la probabilidad al currículo y la falta de software adecuado para la simulación. Sin embargo, en los últimos años la situación ha cambiado, y la propuesta de introducir la simulación como un enfoque alternativo para la enseñanza de la probabilidad ha cobrado gran auge, teniendo como marco un enfoque de la enseñanza de las matemáticas a través de actividades más experimentales ligadas a la vida real, la accesibilidad de la tecnología computacional y el software estadístico. Adicionalmente, el enfoque de simulación permite ligar y establecer una relación entre los enfoques clásico y frecuencial de la probabilidad, situación muy sugerida por diversos autores y estudios de investigación (por ejemplo, Fischbein y Gazit, 1984; Batanero, Henry y Parzysz, 2005; Garutti, Orlandoni, Ricci, 2008). Una revisión del currículo en los niveles preuniversitarios en Estados Unidos, Inglaterra y Australia realizada por Jones, Langrall y Mooney (2007) muestra que entre las grandes ideas de probabilidad se encuentra el uso de simulaciones para modelar fenómenos inciertos y estimar probabilidades. Igualmente Chaput, Girard y Henry (2010) dan cuenta de la incorporación de la simulación y modelación en el currículo francés desde la década de 1990. De esta manera, diversas reformas curriculares en la última década, recomiendan iniciar con un enfoque experimental mediante la construcción de simulaciones de experimentos aleatorios para preparar a los estudiantes para la teoría. En el caso de Francia, se implementó el enfoque frecuencial mediante simulaciones (Chaput, Girard, Henry, 2008). El propósito es preparar a los estudiantes para la ley de los grandes números y comprender la relación entre frecuencia relativa y probabilidad. Investigadores franceses han desarrollado diversas ideas interesantes y han realizado un análisis didáctico en torno a la perspectiva de modelación y simulación en probabilidad (por ejemplo: Girard, 1997; Henry, 1997; Dantal, 1997). Al respecto, Henry (1997) establece la siguiente definición de modelo que adoptamos en este trabajo:

14-

“un modelo es una representación abstracta, simplificada e idealizada de un objeto real, un sistema de relaciones o un proceso evolutivo, dentro de una descripción de la realidad” (p. 78). El proceso de construcción de un modelo y su simulación consta de diferentes etapas. Por ejemplo, Henry (1997) propone la siguiente secuencia:

  • 1. Elaborar un modelo pseudo-concreto y descripción de la realidad. Este paso consiste en observar una situación concreta y describirla en términos simples. Los estudiantes requieren traducir la descripción a una versión de un sistema simplificado y estructurado que permita seleccionar las propiedades de los objetos reales para así diseñar el modelo pseudo-concreto. Por ejemplo en el modelo de urna, se asume que las canicas tienen la misma probabilidad de ser seleccionadas y se determina si la selección será con o sin reemplazo.

  • 2. Matematización y formalización.

Con base en las hipótesis establecidas, los estudiantes deben representar el modelo en un adecuado simbolismo. El modelo debe ser formalizado y las hipótesis verificadas. Finalmente se deben elegir

los procedimientos y herramientas correctas para resolver el problema.

  • 3. Validación e interpretación en el contexto. Los resultados obtenidos se traducen de acuerdo con el modelo pseudo-concreto construido y se da significado a los resultados para responder la pregunta planteada y finalmente confrontar los resultados con la hipótesis del modelo.

Una propuesta más detallada para la formulación de un modelo de simulación mediante el uso de una computadora, la sugieren Gnanadesikan, Scheaffer y Swift (1987):

  • 1. Establecer el problema claramente. Es importante que el problema se establezca con toda la información necesaria y el objetivo de la

simulación sea claro.

  • 2. Definir las componentes clave. Los resultados de la mayoría de las situaciones reales constan de una serie de componentes clave. Es importante definir estas componentes claramente ya que forman la base de la simulación.

  • 3. Establecer los supuestos del problema. La mayoría de los problemas reales requieren algunas hipótesis simplificatorias antes de resolverlos. Estas hipótesis deben estar claramente establecidas.

  • 4. Seleccionar el modelo para generar los resultados para una componente clave. Modelamos una componente clave mediante un mecanismo que genere resultados aleatorios con

probabilidades que correspondan a la situación real.

  • 5. Realizar una prueba para un caso.

Una prueba consiste de una serie de simulaciones de componentes clave que se detiene cuando la situación de interés ha sido simulada una vez.

  • 6. Registrar la observación de interés. Se registra la información necesaria para alcanzar el objetivo del paso 1 y se registra si la prueba fue favorable al evento de interés.

  • 7. Repetir los pasos 5 y 6 un gran número de veces. La estimación de la precisión de una probabilidad requiere que el experimento conste de muchas pruebas.

  • 8. Resumir la información y extraer conclusiones. Se calculan las frecuencia con las que ocurrió el evento de interés. Otros estadísticos también pueden ser calculados.

5. HERRAMIENTAS COMPUTACIONALES PARA LA SIMULACIÓN Y MODELACIÓN

En la actualidad existe una diversidad de herramientas de software que pueden ser utilizadas en la enseñanza de la probabilidad. El proceso de modelación que subyace en cada una de ellas varía en su nivel de abstracción de acuerdo con los propósitos y el nivel educativo para el que fueron pensadas. De tal forma, herramientas que fueron diseñadas con propósitos meramente de exploración de conceptos o para alumnos de niveles básicos de escolaridad, el software incorpora dispositivos aleatorios virtuales lo más parecidos a la realidad (por ejemplo, urnas, dados, ruletas), en los que el usuario puede elegir fácilmente los parámetros del modelo para la simulación. En esta categoría se encuentran herramientas de software como los applets, ProbSim (ver figura 2), ChanceMaker (Pratt, 1998) y SimulaProb (ver figura 3). Otras herramientas de software ofrecen representaciones más formales para la construcción del modelo y la simulación, las cuales son más apropiadas en niveles de bachillerato o superiores, donde además de la exploración de conceptos de pretende desarrollar habilidades de modelación matemática. Ejemplo de estas herramientas son las hojas de cálculo (ver figura 4) y el software estadístico (por ejemplo: Fathom). Sin embargo, en este trabajo restringimos nuestro análisis a dos tipos particulares de herramientas de software como son las hojas de cálculo y los applets.

16-

Fig. 2: Ventana principal de ProbSim (Konold y Miller, 1992) Fig. 3: Ventana de SimulaProb (Gastélum

Fig. 2: Ventana principal de ProbSim (Konold y Miller, 1992)

Fig. 2: Ventana principal de ProbSim (Konold y Miller, 1992) Fig. 3: Ventana de SimulaProb (Gastélum

Fig. 3: Ventana de SimulaProb (Gastélum y Inzunsa, 2007).

Fig. 2: Ventana principal de ProbSim (Konold y Miller, 1992) Fig. 3: Ventana de SimulaProb (Gastélum

Fig. 4: Ejemplo de una actividad desarrollada en la hoja de cálculo Excel (Inzunsa, 2010)

El proceso de simulación liga a las situaciones y problemas con los comandos del software a través de los modelos, por lo que la construcción del modelo apropiado es fundamental para llevar a cabo la simulación, es evidente entonces la relación de dependencia entre modelos y simulación. Sin embargo, Schwartz (2007) identifica algunas diferencias entre ambos: el propósito de hacer un modelo y explorarlo es para exponer los mecanismos subyacentes que gobiernan las relaciones entre las entidades que lo constituyen. En contraste, el propósito de realizar una simulación y correrla es proporcionar a los usuarios una experiencia sustituta de la realidad externa que representa la simulación. Entonces los modelos buscan explicar complejos sistemas referentes, mientras las simulaciones buscan describir situaciones referentes, con frecuencia ofreciendo un rico estímulo multisensorial que ubica a los usuarios en un rico simulacro tanto como sea posible. De esta manera, los desarrolladores de modelos buscan limitar su complejidad para hacer las causas subyacentes mas salientes, mientras que los diseñadores de simulaciones buscan tanta riqueza y complejidad del referente como sea posible para una experiencia perceptualmente tan rica como sea posible. En los ambientes educativos esta diferencia en propósitos hace bastante diferentes los roles para los modelos y las simulaciones.

5.1 ANÁLISIS DIDÁCTICO DE LAS CAPACIDADES DE SIMULACION DE LOS APPLETS

Los Java applets son pequeños programas de computadora escritos en lenguaje JAVA que un navegador de internet ejecuta en el espacio de una página web (ver figura 5). Su propósito es ilustrar, simular y explorar conceptos y principios en un ambiente dinámico y gráfico. El usuario puede acceder a estos programas y ejecutarlos desde su computadora. En conjunto pueden formar un laboratorio virtual donde es posible realizar exploraciones y simulaciones de diversos conceptos. En Inzunsa (2007) realizamos una revisión del potencial de estos recursos para la educación estadística.

18-

Fig. 5: Applet que simula el lanzamiento de una m oneda e ilustra la proporción de

Fig. 5: Applet que simula el lanzamiento de una moneda e ilustra la proporción de caras en muestras de tamaño 10. Tomado de http://www.math.uah.edu/stat/applets/index.html

El applet de la figura 5 simula un experimento de 10 lanzamientos de una moneda, determina la proporción de caras y grafica su distribución para una cantidad especificada de experimentos. El applet proporciona opciones para definir los parámetros del modelo como es la variable aleatoria (número de caras), el tamaño de la muestra (n=10) y la probabilidad de éxito en cada ensayo o lanzamiento (p=0.5), que son los parámetros requeridos por el modelo de probabilidad binomial; proporciona además, la opción de superponer la distribución teórica con la distribución de frecuencias obtenida de la simulación. Como resultado de la simulación emite la secuencia que muestra tal como sucedieron los resultados de la moneda, permitiendo con ello analizar el concepto de aleatoriedad mediante el análisis de rachas y frecuencias de resultados. Proporciona una representación tabular de la frecuencia del resultado de la variable (número de caras) para cada experimento y una distribución de frecuencias de dichas proporciones tanto en su versión tabular como gráfica mediante un histograma de frecuencias. De esta manera, gran parte del potencial de los applets radica en la variedad de representaciones visuales y numéricas que se utilizan para mostrar el comportamiento de un fenómeno aleatorio. Adicionalmente, la retroalimentación inmediata permite observar algún cambio en las representaciones cuando un parámetro o una condición del problema son modificadas. Las representaciones simbólicas que se requieren en otros ambientes para generar el modelo, en estos instrumentos se suplen mediante ventanas o botones que permiten asignar valores al usuario, dotándolos de interactividad tanto en los valores de entrada como en la generación de resultados. Los siguientes applets (ver figuras 6 y 7) permiten estudiar el efecto que tienen sobre la distribución normal, sus parámetros (media y desviación estándar) y la diferencia entre distribución empírica teórica de probabilidad respectivamente.

Figura 6: Efecto de los parámetros en la distribución de probabilidad normal Tomado de: http://www.fernuni-hagen.de/jmittag/repository_es/distributions/normal.html Figura

Figura 6: Efecto de los parámetros en la distribución de probabilidad normal Tomado de: http://www.fernuni-hagen.de/jmittag/repository_es/distributions/normal.html

Figura 6: Efecto de los parámetros en la distribución de probabilidad normal Tomado de: http://www.fernuni-hagen.de/jmittag/repository_es/distributions/normal.html Figura

Figura 7: Distribución teórica contra distribución empírica del lanzamiento de un dado (distribución uniforme discreta) Tomado de: http://www.fernuni-hagen.de/jmittag/repository/dice/uniform.html

En los años recientes ha habido un crecimiento notable en el desarrollo de applets y otros materiales accesibles a través del internet. Investigadores, profesores y organizaciones que promueven la enseñanza de la probabilidad y la estadística se han dado a la tarea de desarrollar applets prácticamente para todos los conceptos que forman parte de un curso de bachillerato y nivel universitario; incluso, se ha empezado a generar investigación en torno a su impacto en el aprendizaje

20-

de los estudiantes y sobre el uso que hacen de ellos los profesores en el aula de clase. Dichos resultados están siendo retomados por los desarrolladores de software para generar ciclos de mejora en la producción de estos componentes. De tal forma, la Asociación Internacional de Educación Estadística (IASE por sus siglas en inglés) en el Congreso Satélite de 2003, dedicó el tema de Internet en la Educación Estadística. A su vez, en otros congresos de la misma IASE, los trabajos sobre el desarrollo de applets y otro tipo de materiales en línea son cada vez más frecuentes. Análisis y resultados de investigación sobre este tipo de herramientas son aún escasos por lo que constituyen un amplio campo de oportunidades de desarrollo y de investigación. Entre los trabajos de investigación que reportan resultados con el uso de applets se encuentran los realizados por Godino et al (2003); Lipson et al (2003); Cunliffe et al (2003) y Cristou, Dinov y Sánchez, (2007). En tiempos muy recientes se ha empezado a desarrollar herramientas que permiten la creación de applets a través del software Geogebra. Dicho software es una aplicación de software libre con código abierto que entre otras muchas ventajas permite la creación de applets interactivos. El desarrollo de applets a través de Geogebra solo requiere que el usuario desarrolle una actividad con ciertos propósitos didácticos y el software convierte la actividad en un applet que puede ser insertado en una página de internet (ver figura 8), exportando las ventanas interactivas con la actividad diseñada a código HTML e incrustando las ventanas en aplicaciones de creación de contenidos de formato universal.

de los estudiantes y sobre el uso que hacen de ellos lo s profesores en el

Fig. 8: Frecuencia relativa de los resultados de una moneda (Simulación con 1500 lanzamientos) Tomado de: http://docentes.educacion.navarra.es/msadaall/geogebra/figuras/dado1grafica.htm

5.2 ANÁLISIS DIDÁCTICO DE LAS CAPACIDADES DE SIMULACIÓN DE LA HOJA DE CÁLCULO

No obstante que la hoja de cálculo fue concebida para automatizar cálculos contables y realizar simulaciones en este dominio, actualmente ha expandido su uso a otras áreas, como es el caso de la educación. De acuerdo a lo señalado por Artigue (2011), en Francia, la hoja de cálculo es utilizada en la enseñanza de las matemáticas desde los primeros años de la secundaria, y su uso es preconizado en aritmética, cálculo, estadística y probabilidad. En la literatura existen diversos trabajos que señalan el potencial de esta herramienta para diversos tópicos de probabilidad y estadística (por ejemplo, Konold, 1994; McClintock y Zhonghong, 1997; Lesser, 1999; Beigie, 2010). Un tipo de hoja de cálculo ampliamente conocida por su facilidad de acceso por los usuarios es la hoja de cálculo Excel, la cual analizamos en el presente trabajo. Excel posee diversas potencialidades en los aspectos representacional, de cálculo y de comunicación, características importantes en la enseñanza de las matemáticas. En el aspecto de comunicación, los usuarios introducen la información de un problema a través de un lenguaje aritmético-algebraico interactivo. Dicha interactividad permite una retroalimentación inmediata cuando se trabaja con una fórmula presionando la tecla F9, con lo cual los usuarios pueden experimentar, conjeturar y encontrar errores en sus procesos de solución. En el aspecto representacional dispone de múltiples representaciones de los objetos matemáticos, permitiendo que varios registros semióticos puedan ser presentados en forma simultánea sobre la pantalla, tal es el caso del registro de fórmulas para expresar relaciones entre celdas, el registro numérico para representar datos o resultados de los cálculos, el registro gráfico que permite al usuario construir varios tipos de representaciones gráficas dinámicamente ligadas a datos numéricos. En el aspecto de cálculo, dispone de una amplia gama de fórmulas que permiten formular modelos, generar datos y realizar cálculos. En el caso específico de la modelación de fenómenos aleatorios, la hoja de cálculo Excel dispone de comandos para generar números pseudoaleatorios, los cuales son la base de la simulación. Cuando los fenómenos aleatorios son simulables a través de modelos de urna –caso que nos ocupa en nuestro trabajo-, Excel dispone de dos comandos que generan números provenientes de una distribución de probabilidad uniforme: aleatorio() y aleatorio.entre(a,b). El comando aleatorio() devuelve un número aleatorio mayor que 0 y menor que 1, mientras que el comando aleatorio.entre(a,b) devuelve un número aleatorio entero entre los límites a y b que se especifican. Con ambos comandos se pueden construir modelos de urna simples (por ejemplo, para simular una moneda), hasta modelos de urna mucho más complejos (por ejemplo, para simular problemas que implican al Teorema de Bayes). Ambos comandos en su forma básica se muestran en las figuras 9 y 10.

22-

Fig. 9: Comando aleatorio.entre(a,b) Fig. 10: Comando aleatorio() Los números pseudoaleatorios generados a través de estas

Fig. 9: Comando aleatorio.entre(a,b)

Fig. 9: Comando aleatorio.entre(a,b) Fig. 10: Comando aleatorio() Los números pseudoaleatorios generados a través de estas

Fig. 10: Comando aleatorio()

Los números pseudoaleatorios generados a través de estas funciones tienen dos propiedades que los

hacen equiparables a números completamente aleatorios:

  • 1. Cualquier número entre 0 y 1 tiene la misma probabilidad de ser generado.

  • 2. Los números generados son independientes unos de otros.

De esta manera, los usuarios pueden realizar la actividad de matematización para generar los modelos y validar sus resultados, poniendo en juego diversas funciones e involucrando diferentes pasos y operaciones de acuerdo a sus esquemas mentales y la permisibilidad la herramienta (hoja de cálculo). De acuerdo con la teoría de la instrumentación (Guin y Trouche, 1999, Artigue, 2002), en el proceso de uso y apropiación de un artefacto el usuario desarrolla esquemas mentales para tareas específicas, en los cuales el conocimiento técnico (habilidades para usar el artefacto) y el conocimiento sobre el dominio específico del contenido matemático se entrelazan o complementan. En el caso de una tarea matemática, un esquema mental involucra la estrategia global de solución, los medios técnicos que el artefacto ofrece y los conceptos matemáticos que subyacen a la estrategia. Para ejemplificar en el contexto de la enseñanza de la probabilidad, cuando los estudiantes utilizan una herramienta como la hoja de cálculo, trabajan con representaciones de objetos matemáticos tales como generadores de números aleatorios, un simbolismo para modelarlos (comandos o funciones) que requieren de sintaxis en sus valores de entrada o parámetros, diferentes tipos gráficas para representar los resultados y medidas estadísticas para describir su comportamiento y resumir los resultados (por ejemplo, frecuencias de eventos favorables). A través de su trabajo e interacción, los estudiantes pueden gradualmente desarrollar la hoja de cálculo como una fuente de aprendizaje, de tal forma que la hoja de cálculo puede llegar a ser un instrumento en cierto nivel para cada estudiante a través de su uso. En este contexto hemos realizado un estudio con estudiantes de primer grado universitario (Inzunsa, 2012). A partir de la actividad matemática realizada por los estudiantes para desarrollar el proceso de simulación con la hoja de cálculo Excel, identificamos tres etapas importantes, con conceptos y características propias que requieren diferentes actividades de matematización por parte de los estudiantes:

1.

Producir los resultados a través de comandos basados en generadores de números aleatorios.

  • 2. Realizar operaciones (aritméticas, lógicas, condicionales) para cumplir con las condiciones del problema.

  • 3. Identificar los resultados favorables para calcular su frecuencia relativa.

Como ejemplo de lo anterior mostramos el modelo desarrollado por dos estudiantes sobre un sencillo problema que trataba de simular el lanzamiento de dos dados y calcular la probabilidad de que la suma de los puntos sea igual a 7. Un estudiante identificó y acumuló los casos favorables a la vez en la misma columna (columna de frecuencia), lo que implicó introducir una fórmula recursiva a partir del segundo renglón (ver figura 11). Los estudiantes que siguieron este mismo esquema cometieron

diversos errores por las dificultades que les representaba la recursividad. Un esquema más sencillo utilizado por otro estudiante (ver figura 12), consistió en identificar los casos favorables a través de un 1 (columna frecuencia) y al final realizar el conteo de casos favorables a través de una suma en una celda determinada de la hoja, evitando así la recursividad. Ambos modelos involucraban diferentes comandos y operaciones matemáticas pero generaban resultados equivalentes.

1. Producir los resultados a través de comandos basa dos en generadores de números aleatorios. 2.
1. Producir los resultados a través de comandos basa dos en generadores de números aleatorios. 2.

Fig. 11: Modelo desarrollado por estudiante 1

Fig. 12: Modelo desarrollado por estudiante 2

Los resultados del presente trabajo muestran que la hoja de cálculo tiene potencialidades que hacen posible que estudiantes universitarios desarrollen un proceso de instrumentación adecuado para resolver problemas de probabilidad a través del método de simulación. Los recursos de la hoja de cálculo, como son las diversas representaciones simbólicas para formular modelos, identificar resultados favorables y calcular frecuencias; la interactividad en la comunicación entre usuario que permite una visualización inmediata de los resultados para retroalimentar y monitorear el proceso de solución, así como su capacidad de cálculo, constituyen elementos importantes que los estudiantes pueden manipular para convertir la hoja de cálculo en una herramienta para resolver problemas de probabilidad desde una perspectiva frecuencial. Sin embargo, el proceso de instrumentación de la hoja de cálculo para simular fenómenos aleatorios no estuvo exento de dificultades. Una de las principales dificultades que identificamos tiene que ver con una concepción de la hoja de cálculo que se deriva del uso que hasta ese momento le

24-

habían dado los estudiantes: la hoja de cálculo como una herramienta que les permite la captura y procesamiento de información de tipo contable y financiera. De esta manera, se explica la estrategia utilizada por muchos estudiantes de capturar información en forma directa para posteriormente realizar cálculos a través de la fórmula clásica de probabilidad, en lugar de utilizar generadores de números aleatorios. La simulación como método de solución de problemas de probabilidad les resultó desafiante, en tanto requiere del uso de diversas representaciones simbólicas para matematizar las relaciones entre las variables y parámetros, por lo que les resultaba más fácil recurrir al enfoque clásico que ellos habían trabajado en sus estudios previos. El estudio nos reveló que el proceso de convertir un artefacto tecnológico en instrumento para la simulación no se constituye de manera inmediata, lo que nos conduce a pensar que es necesaria una planeación didáctica cuidadosa para presentar a los estudiantes el método de simulación como una alternativa confiable para resolver problemas de probabilidad; a su vez es importante un adecuado conocimiento de los aspectos técnicos de la herramienta para que los estudiantes pueden integrarla a sus fines de forma progresiva conforme avanzan en la solución de los problemas.

6. CONCLUSIONES

Entre las diversas formas de utilizar la computadora en la enseñanza de la probabilidad ha sobresalido la construcción de modelos de fenómenos aleatorios y su simulación. El potencial didáctico que se le atribuye tiene en cuenta diversos factores, entre los que podemos destacar la posibilidad de modelar problemas más reales y con menos formalismo matemático a los que son posibles desde la perspectiva clásica y axiomática de la probabilidad, factibilidad de desarrollar ideas estocásticas correctas desde los grados elementales, multiplicidad de representaciones dinámicas simultáneas del mismo concepto visibles y ejecutables en una misma pantalla, interactividad y retroalimentación que permiten al usuario un diálogo directo con la computadora. Si bien la investigación realizada hasta ahora ha reportado diversas ventajas de la simulación en la enseñanza de la probabilidad, los resultados no son completamente satisfactorios, ya que muchos estudiantes no logran desarrollar una comprensión conceptual adecuada de los conceptos en cuestión, a pesar de utilizar herramientas tecnológicas diseñadas con propósitos específicos y de fácil manejo. En el caso de herramientas tecnológicas con diseños más abiertos (por ejemplo: la hoja de cálculo) en las que la modelación requiere de un manejo simbólico más abstracto, la simulación constituye todo un desafío para muchos estudiantes, e incluso para muchos profesores. Diversos estudios han mostrado evidencia de dichas dificultades (por ejemplo: delMas, Chance y Garfield, 1999; Sánchez, 2002; Maxara y Biehler, 2010; Galarza, 2011).

Se requiere aún de mucha investigación tanto con estudiantes como con profesores para conocer las formas más adecuadas para su implementación y los factores que limitan su utilidad en los procesos de enseñanza y aprendizaje de la probabilidad. Ello es necesario además porque nuevas tecnologías están surgiendo, y las existentes mejoran día con día su potencial didáctico. Por otra parte, es necesaria la actualización y formación de profesores de probabilidad en la perspectiva de la construcción de modelos y simulación, sobre todo en aquellos países donde estas ideas tienen poco tiempo de haber llegado al currículo escolar.

5.

REFERENCIAS

Artigue, M. (2002). Learning mathematics in a CAS environment: The genesis of a reflection about instrumentation and the dialectics between technical and conceptual work. International Journal of Computers for Mathematical Learning, 7(3), 245-274.

Artigue M. (2011). Tecnología y enseñanza de las matemáticas: desarrollo y aportes de la aproximación instrumental. Cuadernos de Investigación y Formación en Educación Matemática. (pp. 13-33), 6(8). Costa Rica.

Batanero, C. (2001). Aleatoriedad, Modelización, Simulación. Artículo presentado en la X Jornadas sobre el Aprendizaje y la Enseñanza de las Matemáticas, Zaragoza, España.

Batanero, C., Henry, M. y Parzysz, B. (2005). The nature of chance and probability. En G. Jones (Editor). Exploring probability in school: challenges for teaching and learning. Springer Science+Business Media, Inc. 15-37.

Beigie, D. (2010). Probability experiments with shared spreadsheets. Mathematics Teaching in the Middle School, 15(8). NCTM.

Biehler, R. (1991). Computers in probability education. En R. Kapadia y M. Borovcnik (Eds.). Chance Encounters: probability in education. A review of research and pedagogical perspectives, (pp. 169- 212). Dordrecht: Kluwer.

Borovcnick, M., Bentz, H. y Kapadia, R. (1991). A Perspective Probabilistic. En R. Kapadia y M. Borovcnik (Eds.), Chance Encounters: probability in education. A review of research and pedagogical perspectives, (pp. 27-71). Dordrecht: Kluwer

Chaput, B., Girard, J. C. y Henry, M. (2008). Modeling and simulations in statistics education. Proceedings of the ICMI Study 18 Conference and IASE 2008 Round Table Conference. C. Batanero.; G. Burrill y Ch. Reading (Ed.). Joint ICMI/IASE Study. Monterrey México.

Chaput, B., Girard, J. & Henry, M. (2011). Frequentist Approach: Modeling and Simulation in Statistics and Probability Teaching. In C. Batanero, G. Burril & Ch. Reading (Eds.), Teaching Statistics in School Mathematics-Challenges for Teaching and Teacher Education: A Joint ICMI/IASE Study. The 18th ICMI Study, (pp. 85-95). Springer Science+Business Media.

Cristou, N., Dinov, I. y Sánchez, J.

(2007). Design and Evaluation of SOCR Tools for Simulation.

Proceedings of the IASE/ISI Sattellite. Berlin Germany.

Cunliffe,

R., Regan, M. y Wild, Ch. (2003). Flexible Learning and Large Numbers (A Case Study).

Proceedings of the IASE/ISI Sattellite. Berlin Germany.

Dantal, B. (1997). Les enjeux de la modélisation en probabilité. En Enseigner les probabilités au lycée (pp.57-59). Reims: Commission Inter-IREM.

26-

DelMas, R., Garfield, J. & Chance, B. L. (1999). A Model of Classroom Research in Action:

Developing Simulation Activities to Improve Students ́ Statistical Reasoning. Journal of Statistics Education, 7(3).

English, L. y Sriraman, B. (2010). Problem Solving for the 21st Century. En B. Sriraman y L. English (Eds.), Theories of Mathematics Education: Seeking New Frontiers. Springer, (pp. 263-290). Springer.

Fischbein, E. y Gazit, A. (1984). Does the teaching of probability improve probabilistic intuitions? Educational Studies in Mathematics, 15, 1-24.

Galarza, M. D. (2011). Dificultades que profesores de secundaria tienen en el diseño de actividades de simulación de fenómenos aleatorios en modelos de urna. Tesis de Maestría en Docencia de las Matemáticas. Universidad Autónoma de Sinaloa.

Garuti, R. A., Orlandon, R, Ricci (2008). Which probability we have to meet? A case study about statistical and classical approach to probability in student´s behaviour. En C. Batanero, G. Burrill y Ch. Reading (Eds.), Proceedings of the ICMI Study 18 Conference and IASE 18 Round Table Conference Joint ICMI/STUDY, Monterrey México.

Gastélum, D. A. y Inzunsa, S. (2007). SimulaProb Software. Facultad de Informática de la Universidad Autónoma de Sinaloa.

Girard, J. (1997). Modélisation et simulation. Enseigner les probabilities au lycée. Instituts de Recherche ur l´Enseignment des Mathématiques. Comission inter-IREM STATISTIQUE ET PROBABILITÉS. 245-250.

Gnanadesikan, Scheaffer & Swift (1987). The Art and Techniques of Simulation. Quantitative Literacy Series. Dale Seymour Publications.

Godino, J., Ruiz, F., Roa, R., Pareja, J. y Recio, A. (2003). Analysis of two internet interactive applets for teaching statistics in schools. Proceedings of the IASE/ISI Sattellite. Berlin Germany.

Goldstein, B. E. y Hall, R. (2007). Modeling without end: conflict across organizational and disciplinary boundaries in hábitat convervation planning. En R. Lesh, E. Hamilton y J. Kaput (Eds.), Foundations for the future in mathematics education, (pp. 57-76). Lawrence Erlbaum Associates.

Gottfried, B. (1984). Elements of Stochastic Process Simulation. New Jersey: Prentice Hall.

Guin, D. y Trouche, L. (1999). The complex process of converting tools into mathematical instruments. The case of calculators. The International Journal of Computers for Mathematical Learning. 3(3), 195-197.

Heitele, D. (1975). An epistemological view on fundamental stochastic ideas. Educational Studies in Mathematics, 6, 187-205.

Henry, M. (1997). Notion de modéle et modélistion dans l´enseignement. Enseigner les probabilities au lycée. Instituts de Recherche ur l´Enseignment des Mathématiques. Comission inter-IREM STATISTIQUE ET PROBABILITÉS. 77-84.

Inzunsa, S. (2007). Recursos de internet para apoyo de la investigación y educación e estadística.

Revista

Iberoamericana

de

http://www.rieoei.org/experiencias142.htm

Educación,

41(4).

Disponible

en:

Inzunsa, S. (2012). Ambientes virtuales de aprendizaje: Un enfoque alternativo para la enseñanza y aprendizaje de la inferencia estadística. Revista Mexicana de Investigación Educativa. 15(45), 423- 452. Consejo Mexicano de Investigación Educativa.

Jones, A. G., Langrall, C. W. & Mooney, S. (2007). Research in probability: Responding to Classroom Realities. In F. K. Lester (Ed.), Second Handbook of Research in Mathematics Teaching and Learning, (pp. 909-949), National Council of Teachers of Mathematics.

Konold, C. (1994). Teaching probability through modeling real problems. Mathematics Teacher, 87, 232-235. NCTM.

Konold,

C.

y

Miller,

C.

(1992).

ProbSim

University of Massachusetts, Amherst, MA.

Software.

Scientific

Reasoning

Research

Institute

Lesser, L. (1999). Exploring the birthday problema with spreadsheets. Mathematics Teacher, 92(5), 407-411. NCTM.

Lipson, K., Kokonis, S, y Francis, G. (2003). Investigation of students’ experiences with a web-based computer simulation. Proceedings of the IASE/ISI Sattellite. Berlin Germany.

Maxara, C. y Biehler, R. (2007). Constructing Stochastic Simulations with a Computer Tool- Students’

Competencies and Difficulties. Proceedings of the Fifth Congress of the European Society

Research in Mathematics Education,

(pp.

1–13).

Disponible

ermeweb.free.fr/CERME%205/WG5/5_Maxara.pdf.

for

en:

McClintock, E. y Zhonghong, J. (1997). Spreadsheets: Powerful Tools for Probability Simulations. Mathematics Teacher, 90, 572-579.

NCTM (2000). Principles and Standards for School Mathematics. Reston, VA. Pratt, D. (1998). ChanceMaker Software.

Romerg, T. A., Carpenter, T. P. y Kwako, J. (2005). Standards-Based Reform and Teaching for Understanding. En T. Romberg, T. Carpenter y F. Dremock (Eds.), Understanding Mathematics and Science Matters, (pp. 3-26). Lawrence Erlbaum Associates.

Sánchez, E. (2002). Teacher's Beliefs about usefulness of Simulation with the Educational Software Fathom for Developing Probability Concepts in Statistics Classroom. En B. Phillips (Ed.). Proceedings of the Sixth International Conference on Teaching Statistics. International Association for Statistical Education.

Sánchez, E. y Canal, G. (2003). Computational Simulation and Conditional Probability Problem Solving. Proceedings of the International Statistical Institute 54 Session. Berlin Germany. Disponible en : http://www.stat.auckland.ac.nz/~iase/publications/3/3638.pdf

Schwartz, J. L. (2007). Models, simulations, and exploratory environments: a tentative taxonomy. En Richard Lesh, Eric Hamilton y James Kaput (Eds.). Foundations for the future in mathematics education, (pp. 161-171). Lawrence Erlbaum Associates.

Thistead, R. y Velleman, P. F. (1992). Computer and Modern Statistics. En D. Hoaglin y D. S. Moore (Eds.), Perspectives on Contemporary Statistics (pp. 41-53). Notes No. 21. Mathematical Association of America.

28-

SIMULATION AND MODELS IN TEACHING PROBABILITY: AN ANALYSIS OF THE POTENTIAL OF APPLETS AND SPREADSHEETS

ABSTRACT

In this chapter we analyze the potential of simulation and construction of models in the teaching and learning of probability. Based on the review of literature we identified several advantages and difficulties have been observed after implementation using various computational tools. We emphasize on two software tools such as spreadsheets and applets, and present some results of a research on modeling with Excel spreadsheet with students in a basic course at university level.

Keywords: Simulation, Probability, Applets, Spreadsheets

MODELOS E SIMULAÇÃO NO ENSINO DE PROBABILIDADE: UMA ANÁLISE DO POTENCIAL DO APPLETS E PLANILHAS

RESUMO

Neste capítulo fazemos uma análise do potencial de simulação e modelagem no ensino e aprendizagem de probabilidade. Com base na revisão da literatura identificou várias vantagens e dificuldades têm sido observadas após sua implementação por meio várias ferramentas computacionais. Nossa ênfase é sobre duas ferramentas computacionais, tais como planilhas e applets, e apresentar alguns resultados da pesquisa em modelagem com planilha do Excel que fazemos com os alunos em um curso universitário de nível introdutório.

Palavras-chave: Simulação, probabilidade, applets, planilhas.

SANTIAGO INZUNSA CAZARES

Universidad Autónoma de Sinaloa, México

sinzunza@uas.edu.mx

Especialista en Estadística, Maestro y Doctor en Ciencias en la Especialidad de Matemática Educativa. Profesor e Investigador de Tiempo Completo Titular C en la Facultad de Informática Campus Culiacán

de la Universidad Autónoma de Sinaloa. Miembro del Sistema Nacional de Investigadores, miembro del Sistema Sinaloense de Investigadores y Tecnólogos y Responsable del Cuerpo Académico “Investigación en Tecnologías de la Información y de la Comunicación y sus Aplicaciones.

30-

CAPÍTULO 2

EFECTO DEL TIPO DE INFORMACIÓN Y DEL FORMATO DE LOS DATOS EN LA RESOLUCIÓN DE PROBLEMAS DE PROBABILIDAD CONDICIONAL

GABRIEL YÁÑEZ CANAL

ANA RÁTIVA HERNÁNDEZ

DIANA LOZANO RODRÍGUEZ

RESUMEN

Se presentan en este trabajo los resultados de una investigación sobre el efecto de los formatos y el tipo de información sobre las respuestas, los errores cometidos y las formas de representación en estudiantes universitarios al resolver cierta clase de problemas binarios (con dos eventos y sus complementos) de probabilidad condicional. Los problemas aplicados se diferencian por el tipo de información que presentan: en algunos de ellos la información estaba constituida por dos probabilidades conjuntas y una probabilidad marginal, en tanto que para otros la información eran dos probabilidades conjuntas y una probabilidad condicional, y por el formato de presentación:

frecuencias naturales, porcentajes y decimales. El estudio se realizó con estudiantes de diversas carreras de la Universidad Industrial de Santander en Bucaramanga, Colombia. Los resultados mostraron que el tipo de información, más que el formato utilizado, tiene efectos en la resolución del problema. De otro lado, el estudio mostró que la confusión entre probabilidad condicional y probabilidad conjunta es refractaria tanto al formato como al tipo de información, al menos para el tipo de problemas propuestos. La representación algebraica fue la más utilizada por los estudiantes.

Palabras claves: Problema binario de probabilidad condicional; tipo de información; formato de presentación y representaciones.

1.

INTRODUCCIÓN

La probabilidad condicional es un concepto fundamental de la probabilidad que muestra el efecto que puede tener la ocurrencia previa de un evento sobre la probabilidad de ocurrencia de otro. Si bien el cálculo de la probabilidad condicional solamente requiere tomar como nuevo espacio muestral el evento que ya sucedió y calcular las probabilidades de los eventos inciertos ajustados a este nuevo espacio, su comprensión y aprendizaje encierran muchas dificultades de diversa índole. La investigación sobre estas dificultades se ha afrontado desde muy diversos puntos de vista. En un principio, la investigación estuvo dirigida a identificar las concepciones y sesgos que las personas poseen sobre la probabilidad condicional. En esta dirección son clásicos los resultados de Kahneman y Tversky, producto de sus investigaciones en los años 70 del siglo pasado, y que se pueden consultar en

el texto Judgment Under Uncertainty: Heuristic and Biases (1982), editado por estos autores junto a Slovic. Entre sus hallazgos se destaca el olvido de la tasa base para el cálculo de probabilidades condicionales utilizando el teorema de Bayes, que hace referencia a la desconsideración de las probabilidades a priori para el cálculo de las probabilidades a posteriori (Kahneman y Tversky, 1982a). Sin embargo, también hallaron que este olvido se morigera cuando existe una clara relación causal entre los dos eventos (Tversky y Kahneman, 1982). Estos autores recurren al uso de las heurísticas para explicar el olvido de la tasa de base. La heurística que la explica, según Kahneman y Tversky, es la heurística de la representatividad, que consiste en calcular la probabilidad de un evento con base en su representatividad respecto a la población de la cual proviene. Esta heurística que refleja un pensamiento muy válido en los procesos de muestreo estadísticos, en muchas ocasiones conduce a sesgos en los juicios que se realizan. De otro lado, diversas investigaciones son reiterativas en las confusiones que se presentan a la hora de definir la probabilidad condicional. Una de estas confusiones es la conocida como la falacia de la

condicional transpuesta que no es otra cosa que asumir la probabilidad ( B | A) cuando en realidad se

trata de la transpuesta ( A | B ) (Falk, 1986, Ojeda, 1994, Yáñez, 2003, Díaz y De la Fuente, 2006). Si bien la expresión matemática de estas condicionales no da lugar a confusiones, el asunto estriba en la interpretación de los múltiples contextos y de las distintas formas en que se puede presentar la probabilidad condicional. Esta confusión, que prevalece entre estudiantes y profesionales de todos los niveles, y que está especialmente relacionada con la interpretación de los test estadísticos de significancia, también es citada por Eddy (1982) en referencia a contextos médicos. Vallecillos (1995), dice que esta confusión aparece cuando ven el test de hipótesis como procedimiento inductivo que permite calcular la probabilidad “a posteriori” de la hipótesis nula. Más específicamente, la confusión se observa en la interpretación que dan unos estudiantes al nivel de significación en un contraste de hipótesis. A su vez, otras investigaciones reportan que para algunos estudiantes la suma de estas condicionales es 100% (Pollatsek et al., 1987; Yáñez, 2003). Otra de las confusiones a que da lugar el lenguaje natural en sus diversas manifestaciones, se da entre probabilidades condicionales y probabilidades conjuntas, aspecto éste que se relata en muchas de las investigaciones realizadas sobre probabilidad condicional (Falk, 1986; Pollatsek et al., 1987; Yáñez, 2003; Estrada, et. al., 2005; Díaz y de la Fuente, 2005). Adicionalmente, Falk (1986) y Gras y Totohasina (1995) describen la interpretación de la condicionalidad como causalidad que es cuando las personas interpretan la probabilidad condicional ( A | B ) como una relación causal implícita, donde el suceso condicionante es la causa y el condicionado es la consecuencia. Asociado con esta concepción causal de la probabilidad condicional

se presenta la concepción cronologista que se manifiesta cuando los eventos condicionante y condicionado están separados en el tiempo, es decir, no ocurren simultáneamente sino que media un espacio de tiempo entre sus ocurrencias. En estas situaciones muchas personas manifiestan la imposibilidad de que un evento que ocurre después pueda condicionar o afectar la probabilidad de ocurrencia de un evento que es anterior en el tiempo (Falk, 1996; Gras y Totohasina, 1995). Falk (1996) relata esta concepción con el experimento de extracción sin reposición de dos bolas de una urna que contiene dos bolas blancas y dos bolas negras al preguntar: ¿cuál es la probabilidad de haber obtenido una bola blanca en la primera extracción cuando se sabe que en la segunda extracción se obtuvo una bola blanca? Una gran parte de los sujetos responden que es ½ porque la segunda bola extraída no influye sobre la primera extracción. Gras y Totohasina (1995) arguyen que estas concepciones causal y cronológica de la probabilidad condicional pueden estar siendo inducidas por las expresiones con las que se suele enunciar la probabilidad condicional: “A si B” y “A dado B”, respectivamente. Otra corriente de investigación en probabilidad condicional la constituyen el uso de diversas representaciones semióticas en la resolución de problemas. Estudios como los de Parzysz (1990), Dupuis y Rousset-Bert (1996) y Ávila (2001), evidencian cómo se potencializa la capacidad de resolver problemas de probabilidad condicional al utilizar diagramas de árbol, tablas de doble entrada y, en algunas ocasiones, los diagramas de Venn. Shaughnessy (2002) destaca la utilización de las tablas de contingencia o de doble entrada cuando se asume un enfoque de frecuencias naturales para resolver problemas de probabilidad condicional. En este mismo contexto, Yáñez (2001), asumiendo problemas binarios de probabilidad condicional, en el sentido de que solo se consideran dos eventos y sus complementos, determina claramente el alcance y las limitaciones de los diagramas de árbol y de las tablas para resolver problemas de probabilidad condicional, así como las exigencias operativas que exige la solución algebraica. Otra línea de investigación relacionada con la dificultad para resolver problemas de probabilidad condicional hace referencia a la forma en que se presenta la información: formato de probabilidad 1 ,

1 Formato de probabilidad: la información está dada en probabilidades y los valores numéricos en porcentajes; formatos de frecuencias relativas: igual que el formato de probabilidad pero sin utilizar la palabra probabilidad en la información, esta solo aparece en la pregunta final. Formato de frecuencias naturales: los porcentajes se traducen en función de un universo que permita trabajar con expresiones enteras, por ejemplo si el problema en formato de probabilidad tiene la forma: “La probabilidad de cáncer de pecho es 1% en una mujer de cuarenta años que participa en un estudio de rutina. Si una mujer tiene cáncer de pecho, la probabilidad de que obtenga una mamografía positiva es 80%,… se traduce en formato de frecuencias de la siguiente forma: “10 de cada 1000 mujeres de 40 años que participaron en un estudio de rutina tienen cáncer de pecho. 8 de cada 10 mujeres con cáncer de pecho obtienen una mamografía positiva…”

formato de frecuencias relativas o porcentajes, o formato de frecuencias naturales. Gigerenzer y Hoffrage (1995) realizaron una investigación del razonamiento involucrado en los problemas que implican el uso del teorema de Bayes, llegando a la conclusión de que dicho razonamiento se mejora cuando a las personas se les presenta la información en formato de frecuencias naturales. Los formatos en frecuencias relativas producen la misma proporción de buenas respuestas que los formatos de probabilidad. En consecuencia, dicen los autores, la enseñanza de estos temas debe estar dirigida fundamentalmente a que los estudiantes puedan pasar del formato de probabilidades o porcentajes al formato de frecuencias naturales y evitar enseñar a insertar probabilidades en la fórmula de Bayes. En esta misma dirección están las investigaciones de Cosmides y Tobby (1996); Hoffrage, et. al (2002), y Martignon y Wassner (2002) y Sin embargo, los resultados de otras investigaciones conducen a pensar que no siempre las frecuencias naturales facilitan la resolución de un problema de probabilidad condicional (Lewis y Keren, 1999; Mellers y McGraw, 1999; Evans y et.al., 2000; Girotto y González

2002).

Lewis y Keren (1999), para destacar la cercana relación entre los formatos y el tipo de información, realizaron una investigación con el ánimo de probar que las mejoras reportadas por Gigerenzer y Hoffrage (1995) son producto más de la información que se suministra que del formato en que se presenta. Aclaran que la presentación de las probabilidades condicionales en formato de frecuencias naturales contiene algo más que esto, existe una continuidad en la información dada en el sentido de que la información condicional se da sobre los resultados favorables al evento marginal condicionante, logrando que las probabilidades condicionales se asimilen con las probabilidades conjuntas, facilitando de esta manera la solución de los problemas. En conclusión, añaden los autores, lo que hace más fácil el problema es el tipo de información y no el formato en que se presenta. Gigerenzer & Hoffrage (1999) responden a Lewis & Keren (1999) diciendo que si el efecto del formato de frecuencias fuera debido fundamentalmente a que la información se presenta con intersecciones, como Lewis & Keren (1999) afirman, entonces el formato de probabilidad con intersecciones conduciría a un rendimiento similar al obtenido con el formato de frecuencias. Pero no es el caso, los resultados del estudio de 1995 muestran que con formato de probabilidades sólo se obtuvo 28% de respuestas bayesianas, en tanto que con el formato de frecuencias se alcanzó el 50%. A su vez, Mellers & McGraw (1999), introducen otro punto de vista en esta discusión: el valor de la probabilidad de los eventos en juego. Los autores definen eventos raros como aquellos cuyas probabilidades oscilan alrededor del 0.5%, y eventos frecuentes son los que tienen probabilidades de ocurrencia alejadas de esas vecindades. Los autores realizaron dos estudios: en el primero, considerando eventos raros obtuvieron resultados que muestran el buen efecto de los formatos de frecuencia frente a los de probabilidad. En el segundo estudio, los eventos considerados son más

comunes y se obtienen resultados opuestos: el rendimiento depende del tipo de información más que de la forma. Ni las probabilidades ni las frecuencias producen consistentemente un mejor rendimiento. Las frecuencias en las tareas con información conjunta en muestreo natural producen mejores respuestas (17%) que las probabilidades en el formato estándar (4%). No obstante, las probabilidades en formato corto producen un mejor porcentaje de respuestas acertadas (16%) que las frecuencias en formato estándar 2 (8%). En conclusión, dicen los autores, si tuviéramos que seleccionar una forma simple en la cual presentar información, recomendaríamos las frecuencias. Con eventos raros (5%), las frecuencias facilitan el razonamiento bayesiano. Si uno tuviera que seleccionar un solo tipo de información, recomendaríamos el menú corto o, más generalmente, cualquier tipo de información que permita a las personas visualizar conjuntos encajados (uno contenido en el otro). En un estudio sobre formatos de presentación de problemas de probabilidad condicional en el que mostraron los resultados de tres experimentos, Evans y et.al., (2000) apoyan la hipótesis de que no necesariamente las frecuencias naturales facilitan el proceso de solución de un problema de probabilidad condicional. Incluso, mostraron cómo el uso de frecuencias puede promover sesgos influenciados por la información. Entre sus conclusiones se destaca el hecho de que el olvido de la tasa de base podría deberse a la congruencia entre el formato de la pregunta y el formato de la tasa de base, es decir, si la pregunta y la tasa base se presentan en el mismo formato, la ocurrencia de este sesgo es mayor. A su vez, destacan que la manera como los participantes responden está fuertemente influenciada por variaciones sutiles en la presentación de la tarea, la cual hace más o menos fácil la construcción de modelos mentales que ayudan a encontrar la solución. Algo común que poseen la gran mayoría de las referencias citadas, referentes al estudio del efecto del formato y del tipo de información sobre la capacidad de resolver problemas de probabilidad condicional, es que se han concentrado básicamente en problemas asociados con el razonamiento bayesiano en el sentido de calcular probabilidades condicionales inversas a partir del conocimiento de probabilidades condicionales, probabilidades marginales y verosimilitudes. Si bien este tipo de problemas son los de mayor utilidad y aplicación práctica, no son los únicos que se relacionan con la comprensión de la probabilidad condicional, al contrario, existe una variedad distinta de problemas que, si bien no son tan interesantes, sí pueden ayudar a identificar las dificultades que representan los

2 En el menú estándar se da como información

H , D | H y D | H , y en el menú corto se da

D H y

D H

o D H y D , donde H (o H su negación) es el evento del que se

quiere conocer su probabilidad dado el evento D .

problemas bayesianos en la medida que pueden brindar luces sobre la forma de razonar de las personas alrededor de la probabilidad condicional. Los problemas de probabilidad condicional más frecuentes en los textos escolares y, a su vez, los más simples, son los que en este artículo denominamos binarios que son aquellos en que intervienen dos eventos A y B junto con sus complementos. Un problema binario contiene cuatro probabilidades marginales, cuatro intersecciones y ocho probabilidades condicionales, dando lugar a una enorme variedad de tipos de problemas de acuerdo a la información presentada y a las preguntas formuladas. Con el ánimo de estudiar teóricamente la dificultad de los problemas binarios de probabilidad condicional, Yáñez (2001) los clasifica en consonancia con la cantidad de probabilidades condicionales, probabilidades conjuntas y probabilidades marginales presentes en la parte informativa del problema, después de demostrar que para resolver totalmente un problema binario de probabilidad condicional, encontrar las 16 probabilidades que contiene, solo se requiere conocer tres probabilidades que guarden entre sí cierto tipo de relaciones. Yáñez (2001), como consecuencia de un análisis a priori del número de operaciones algebraicas necesarias para resolver completamente un problema de probabilidad condicional, y de la dificultad que encierran cada una de ellas, conjetura que la dificultad para resolver un problema es directamente proporcional al número de probabilidades condicionales que el problema contiene en su parte informativa. Esta clasificación de los problemas binarios generales de probabilidad condicional, dan lugar a un sinnúmero de problemas particulares en relación directa con la información suministrada, las preguntas realizadas y el formato en que se presente la información. Lonjedo (2007) y Carles et. al. (2009) en la dirección propuesta por Yáñez (2001), realizan variadas investigaciones para diversos tipos de problemas de probabilidad condicional con el ánimo de investigar el efecto que sobre su facilidad de solución tienen variables como la información suministrada, la pregunta a resolver, el formato utilizado y el uso de variadas expresiones para referirse a la condicionalidad. Con relación al efecto de los formatos de presentación de la información, los autores concluyen que presentar el dato condicional como porcentaje, cuando todos los demás datos se dan en frecuencias naturales, contribuye positivamente a disminuir el porcentaje de estudiantes que confunden la probabilidad condicional con la conjunta. A su vez, el porcentaje de estudiantes que resuelve correctamente el problema es mayor para el caso del formato de porcentajes que para el formato de probabilidades. Motivados por estos antecedentes, y ante la importancia del tema, nos propusimos realizar una investigación que diera respuesta a las siguientes preguntas: si se asumen otros problemas de probabilidad condicional diferentes a los directamente relacionados con el teorema de Bayes: 1. ¿Qué efectos tiene el formato de presentación del problema y el tipo de información suministrado sobre la

capacidad de resolverlos? 2. ¿Qué efectos tiene la información y el formato sobre la aparición de sesgos y malas concepciones relacionados con la probabilidad condicional? y 3. ¿El formato y la información influyen sobre la adopción de una cierta representación para resolver el problema? Para responder estas preguntas se elaboraron dos cuestionarios que fueron aplicados a estudiantes universitarios de ciencias o ingeniería que ya habían cursado un curso básico de probabilidad y estadística. En este artículo presentamos algunos de los resultados de esta investigación. El artículo está organizado de la siguiente forma: iniciamos explicando brevemente la clasificación de Yáñez (2001) de los problemas de probabilidad condicional, ya que es el soporte para el tipo de problemas que abordamos en esta investigación, luego describimos la metodología utilizada y presentamos una discusión de los resultados obtenidos. Finalmente se presentan las conclusiones, las referencias citadas a lo largo del trabajo y los cuestionarios aplicados.

  • 2. CLASIFICACIÓN DE LOS PROBLEMAS BINARIOS DE PROBABILIDAD CONDICIONAL

Yáñez (2001), con base en un análisis algebraico sobre las relaciones fundamentales que existen entre probabilidades conjuntas, marginales y condicionales, clasifica los problemas binarios (los que solo tienen dos eventos A y B con sus respectivos complementos) resolubles de probabilidad condicional en los siguientes cuatro niveles que, a su vez, agrupan varios casos dependiendo de la información que contengan:

De Nivel 0: aquellos que en su parte informativa no presentan información condicional.

  • Caso 1: Tres intersecciones

  • Caso 2: Dos intersecciones y una marginal

  • Caso 3: Dos marginales y una intersección

De Nivel 1: aquellos que en su parte informativa presentan una condicional.

  • Caso 4: Dos marginales y una condicional

  • Caso 5: Dos intersecciones y una condicional

  • Caso 6: Una marginal, una intersección y una condicional

De Nivel 2: aquellos que en su parte informativa presentan dos condicionales.

  • Caso 7: Una marginal y dos condicionales De este caso se pueden dar tres tipos de problemas:

i)

Una condicional asociada con la marginal y la otra asociada con el complemento de la

ii)

marginal. Una condicional asociada con la marginal dada, y la otra asociada con la otra marginal.

iii)

Las condicionales están asociadas con la otra marginal y su complemento.

  • Caso 8: Una intersección y dos condicionales

De Nivel 3: aquellos que en su parte informativa presentan tres condicionales.

  • Caso 9: Tres condicionales

El análisis del nivel de dificultad de la solución algebraica de los 9 casos considerados permitió a Yáñez conjeturar que el nivel de dificultad de un problema de probabilidad condicional (cuando se pretende hallar todos los elementos faltantes) depende directamente del número de probabilidades condicionales que contenga su parte informativa. De otro lado, el análisis de la potencia de los diagramas de árbol y de las tablas 2x2 para resolver estos problemas, le permitió definir claramente los límites de la capacidad que tienen estas dos populares representaciones para resolver problemas de probabilidad condicional. Así, por ejemplo, el diagrama de árbol es totalmente congruente con los problemas de probabilidad condicional analizados por Gigerenzer y Hoffrage (1995) y Martignon y Wassner (2002) (caso 7(i)) lo que da fuerza al hecho de que la información dada admite un orden que permite concatenar los razonamientos de forma continua. En la Figura 1 se visualiza la ubicación de la información dada en un problema congruente con el tipo 7(i) (Yáñez, 2001): dos condicionales y una marginal que junto con su complemento son los eventos condicionantes de las condicionales dadas. Obsérvese como rápidamente se hallan los

complementos (B ) , A | B y A | B ,

y luego, al multiplicar las marginales por las respectivas

condicionales en cada rama, se obtienen las intersecciones A B , A B , A B y A B ; la suma de las intersecciones adecuadas, como lo indica el mismo diagrama, arroja como resultado las marginales A y A . Con estos datos ya es posible responder a cualquier pregunta que se haga conociendo las relaciones básicas entre probabilidades.

Figura 1. Diagrama de árbol para un problem a binario tipo 7(i) de probabilidad condicional. En

Figura 1. Diagrama de árbol para un problema binario tipo 7(i) de probabilidad condicional.

En este orden de ideas, y con ánimo explicativo, veamos lo que sucede con el árbol cuando se cambia el tipo de información y se pide responder a la misma pregunta. Consideremos el caso 2: dos intersecciones y una marginal. Cualesquiera que sean estas, se observa que su ubicación en el diagrama de árbol ya no es continua, aspecto que dificulta los razonamientos necesarios para resolver el problema. El caso 7 (i) lleva a hacer una construcción en secuencia y siempre hacia adelante del diagrama de árbol, mientras que para el caso 2 la construcción obliga a ir adelante para luego retroceder para completar todos los datos, aspecto que, de alguna manera, complica la obtención de la información necesaria para dar solución al problema. Sin embargo, para el caso 2, por el tipo de información que se presenta, los datos se pueden ajustar mucho mejor a una tabla de doble entrada, lo que facilitaría mucho la obtención de los demás datos y, por ello, la solución del problema. Sin embargo, en problemas que responden, por ejemplo, al caso 5 (dos intersecciones y una condicional) no se puede decir que la tabla o el árbol se comporte uno mejor que otro. Adicionalmente, al resolver completamente los dos problemas con la representación algebraica se observa que los problemas de caso 5 son más exigentes que los de caso 2. De este análisis se infiere, a priori, que cambiar el tipo de información hace que unos problemas sean más fáciles de resolver que otros y que, por consiguiente, resolver un problema de probabilidad condicional con éxito esté ligado al tipo de información que se presenta. Respecto al efecto que pueda tener el formato de presentación de la información sobre la solución de los problemas de probabilidad condicional no se encuentran razones matemáticas más allá de las aritméticas, en el sentido de que las frecuencias naturales son más simples que las razones involucradas en los formatos de porcentajes y probabilidades.

3.

METODOLOGÍA

La población objeto de estudio son los estudiantes universitarios que han tomado al menos un curso de probabilidad y estadística. La muestra estuvo conformada por 457 estudiantes activos de la Universidad Industrial de Santander, Bucaramanga, Colombia, del primer y segundo semestre académico del 2009 de las carreras de Licenciatura en Matemáticas (101), Economía (21), Ingeniería de Sistemas (68), Ingeniería Industrial (90), Ingeniería Eléctrica (35), Ingeniería Civil (100) e Ingeniería Electrónica (62) que participaron respondiendo solamente alguno de los tres cuestionarios construidos. La investigación se desarrolló en tres fases que se dieron en momentos distintos y con cuestionarios diferentes. La primera fase fue un estudio piloto con el objetivo de generar una idea a priori sobre la dificultad de los problemas binarios de probabilidad condicional y evaluar la redacción de los mismos. En esta fase participaron 50 estudiantes de licenciatura en matemáticas que se encontraban tomando un curso de estadística: 32 de ellos se enfrentaron a 5 problemas asociados a los casos 1,2,3,4 y 5 de la clasificación de Yáñez (2001); los otros 18 presentaron otra prueba con 4 problemas pertenecientes a los casos 6,7,8 y 9. Los resultados mostraron que los problemas de nivel 2 y 3 (casos 7, 8 y 9) fueron de enorme dificultad para los estudiantes en tanto que los de nivel 0 y 1 presentaron mayores índices de respuesta. En consecuencia se decidió que en las siguientes fases se presentarían problemas correspondientes a los casos 2 y 5. Los problemas de los casos 2 y 5, según la clasificación de Yáñez (2001), poseen la siguiente estructura: Caso 2: Dos intersecciones y una marginal (nivel 0, pues no presenta condicionales en su información) que no estén asociadas, es decir, que la suma de las probabilidades conjuntas no sea igual a la probabilidad marginal. Caso 5: Dos intersecciones y una condicional (nivel 1, presenta una condicional en su información) de tal forma que la intersección entre el evento condicionante y el evento condicionado sea una de las intersecciones dadas. Los formatos utilizados fueron el de probabilidad, el de frecuencias naturales o absolutas y el de porcentajes. Los formatos tienen las siguientes características: en el formato de probabilidad la información es probabilística con datos en expresión decimal y se indaga por una probabilidad; en el formato de frecuencias absolutas la información está dada con valores enteros y solo se menciona la palabra probabilidad en la pregunta; para el caso 5 con información condicional ésta se presenta en formato de muestreo sistemático (Mellers y McGraw, 1999) que tiene la forma: “de cada 100 que están en A, n también están en B” ; en el formato de porcentajes o frecuencias relativas se presenta la información en porcentajes y la pregunta indaga por un porcentaje (problema aritmético) o una probabilidad.

En la segunda fase se consideró pertinente dividir la muestra seleccionada de estudiantes en dos grupos: el primero conformado por 281 estudiantes que estaban en su primer curso de estadística; el segundo grupo lo conformaban 151 estudiantes que cursaban un segundo curso de estadística. Ambos grupos ya habían estudiado los temas relacionados con probabilidad condicional, incluido el teorema de Bayes. Para el primer grupo se elaboraron dos problemas de probabilidad condicional de caso 2, y dos problemas de aritmética relacionados con porcentajes con el ánimo de saber si los contextos aleatorios son los que dificultan los problemas o si, en últimas, se trata es de debilidades en el razonamiento proporcional. Todos los problemas planteaban una pregunta de probabilidad condicional y tenían la siguiente estructura: uno con formato de frecuencias absolutas, otro con formato de probabilidades; los dos problemas aritméticos eran uno con formato de frecuencias absolutas y el otro con porcentajes. Para el segundo grupo se diseñaron tres problemas del caso 5: dos de probabilidad y uno aritmético, con diferentes formatos y con preguntas diferentes. El aritmético con formato de porcentajes y pregunta de porcentaje marginal; ambos problemas de probabilidad con formato de probabilidades, en uno se pregunta por una probabilidad marginal y en el otro se pregunta por la probabilidad de una intersección. En el Anexo 1 se encuentra el texto de los problemas aplicados en ambos grupos. Ya conocidos los resultados de las dos primeras fases, se diseñó una tercera que consistió de dos problemas de caso 5, uno con formato de frecuencias absolutas y otro con formato de porcentajes, y ambos con tres preguntas en formato de probabilidad que indagaban por una condicional, una marginal y una intersección. Se seleccionaron 25 estudiantes de licenciatura en matemáticas que cursaban estadística II y que habían recibido instrucción sobre el manejo de los diagramas de árbol y de las tablas de doble entrada. En esta fase se pretendía conocer si el formato de presentación de los problemas tenía alguna influencia en su solución y en la representación utilizada para resolverlos.

  • 4. RESULTADOS Y DISCUSIÓN

Con el fin de analizar los resultados de la aplicación de los cuestionarios que se aplicaron a los dos grupos de estudiantes en la fase dos, se organizaron sus respuestas según las características que mostraron en el proceso de resolución de cada problema. A continuación se describen los aspectos que se tuvieron en cuenta en el análisis.

Respuesta correcta: tanto los procedimientos como las representaciones utilizadas y la respuesta son correctos. No responde: no muestra ningún proceso de resolución.

Confunde

probabilidad

condicional

y

conjunta:

interpreta

A | B

como

A B o viceversa.

 

Confunde una probabilidad condicional con su inversa: interpreta A | B como B | Ao

toma A | B    B | A.

 

Representaciones utilizadas: aritmético-algebraicas, tablas de doble entrada, diagramas de árbol y diagramas de Venn.

Tabla 1. Porcentaje de estudiantes en los aspectos considerados en la segunda fase.

GRUPO 1 - Caso 2 (281 Estudiantes) GRUPO 2 - Caso 5 (151 Estudiantes)
GRUPO 1 - Caso 2
(281 Estudiantes)
GRUPO 2 - Caso 5
(151 Estudiantes)
 

Problemas de

Problemas

Problemas

Problemas de

RESPUESTA

probabilidad

Aritméticos

Aritméticos

Probabilidad

Frec_Cond

Prob_Cond

Frec_Cond

Porc_Cond

Porc_Marg

Prob_Inter

Prob_Cond

Problema 1

Problema 2

Problema 3

Problema 4

Problema 1

Problema 2

Problema 3

Respuesta

correcta

20%

23%

43%

35%

9%

18%

0%

No respondió

23%

46%

0%

6%

26%

24%

48%

Confunde

probabilidad

17%

25%

38%

21%

24%

28%

55%

condicional y

conjunta

Confunde una

probabilidad

8%

7%

6%

1%

7%

2%

8%

condicional con

su inversa

 

REPRESENTACIONES

 

Tabla de doble

2%

0%

5%

4%

7%

6%

0%

entrada Álgebra o aritmética

28%

27%

82%

50%

41%

42%

52%

Diagrama de

35%

12%

4%

37%

29%

22%

5%

Venn

Diagrama de

12%

15%

9%

6%

7%

10%

13%

Árbol

A partir del análisis de los resultados que se resumen en la Tabla 1, se pueden hacer los siguientes comentarios:

Salvo el problema 3 (aritmético) del Grupo 1 que todos intentaron resolverlo, los demás tuvieron porcentajes de no respuesta que oscilan entre 6% y 48%. Los más altos porcentajes

corresponden a los problemas con formato de probabilidad (expresión decimal) y pregunta condicional, siendo ligeramente mayor el porcentaje del caso 5 (48% en el problema 3, Grupo 2, frente al 46% del problema 2 en el Grupo 1). Se confirma la hipótesis de Yáñez (2001) en el sentido de que los problemas con información condicional son más difíciles de responder: los problemas del caso 2 obtuvieron significativamente mayores porcentajes de respuestas que los de caso 5. El efecto formato de información no se presentó en los problemas de probabilidad de caso 2, sin embargo el formato de probabilidad obtuvo un porcentaje de respuestas correctas (23%) ligeramente superior al formato de frecuencias (20%). En los problemas aritméticos de caso 2, los porcentajes de buenas respuestas fueron mucho mayores que en los problemas probabilísticos, dando a entender que, si bien existen dificultades con los problemas aritméticos que indagan por frecuencias relativas condicionadas, las mayores dificultades se relacionan con el significado de la probabilidad. En estos problemas, el formato tuvo su efecto: el problema con frecuencias absolutas obtuvo mayor número de buenas respuestas que el formato de porcentajes: 44% y 37.5%. Los resultados de los problemas 2 y 3 de caso 5, permiten observar el efecto de la pregunta realizada sobre el éxito al responderla, cuando se utiliza formato de probabilidad: es más exitoso el problema que indaga por una intersección (17%) que el que indaga por una condicional (8%). Con resultados intermedios se encuentra el problema aritmético que indagaba por un porcentaje marginal con información porcentual (11.5%).

En cuanto a las representaciones utilizadas lo primero que salta a la vista es el mayoritario porcentaje de estudiantes que utilizaron la representación aritmético-algebraica, los porcentajes oscilan entre el 27% para el problema 2 del Grupo 1 el 82% para el problema 3 del mismo grupo. Este último problema es un problema aritmético y fue el de mayor éxito: 43% de los estudiantes a los que se aplicó lo resolvieron. Las tablas de doble entrada fueron muy poco usadas por estos estudiantes, no obstante que los problemas de caso 2 todos son congruentes con la tabla. Extrañamente, el problema en el que más se usó (7%) fue en el problema 1 del grupo 2 que es un problema aritmético, en porcentajes y que pregunta por un porcentaje condicional. El diagrama de Venn fue bastante utilizado en algunos problemas: en el problema 1 del Grupo 1 que preguntaba por una probabilidad condicional (35%) y por los problemas 4 del Grupo 1 y 1 del Grupo 2 con porcentajes de 37% y 29% respectivamente, ambos aritméticos, el primero de caso 2 y el segundo de caso 5 y ambos con preguntas condicionales. Es claro que esta representación es apenas parcial para este tipo de problemas ya que no es posible representar en ella la condicionalidad. Los diagramas de árbol, tan útiles en situaciones propias del teorema de

Bayes, también fueron usadas por los estudiantes: menos usados en los problemas aritméticos menos del 10%) y más usados en los problemas probabilísticos, en especial en los que se requería calcular una probabilidad condicional (problemas 1 y 2 del Grupo 1 y problema 3 del Grupo 2). Ninguno de los problemas en que se utilizó era congruente con el diagrama de árbol por lo que se utilización no permitía la obtención rápida de la respuesta. Los problemas de la tercera fase de caso 5 (ver Anexo 2), a diferencia de los de la segunda, preguntan sobre probabilidades condicional, conjunta y marginal. Los resultados indican más éxito para el formato de porcentajes (problema 2) que para el formato de frecuencias absolutas (problema 2):

60% (12) vs 30% (6). La gran mayoría de los estudiantes intentaron resolver el problema 1 utilizando una tabla de doble entrada (13) en tanto que 5 intentan la solución algebraica y solo 2 usan el árbol. De los 6 que lo resolvieron correctamente, 5 utilizaron la tabla como representación, el otro exitoso utilizó la representación algebraica. Dado que la información condicional no permitía obtener un valor entero para el número de estudiantes que perdieron biología, tal como dice el problema, los estudiantes universitarios que hicieron bien el problema transformaron la información frecuencial a porcentajes, y tres de ellos utilizaron regla de tres para resolverlo adecuadamente. En lo que se refiere al problema 2, 11 estudiantes utilizaron la tabla (10 lo resolvieron bien); 5 utilizaron álgebra (2 lo resolvieron acertadamente) y 2 intentaron infructuosamente que el árbol les ayudara a resolverlo. La Figura 2 muestra la forma en que Sebastián utilizó regla de tres para hallar la marginal que requería para completar las tablas en ambos problemas que le permitieron responder exitosamente las tres preguntas propuestas. La interpretación de la proporcionalidad utilizada por Sebastián se explica con la definición del la probabilidad condicional dada:

(

P noE

/

noB

)

(

P noE

y noB

)

(

P noB

)

(

P noB

)

(

P noE

y noB

)

(

P noE

/

noB

)

(1)

Ahora bien, en la expresión (1) si se expresan las probabilidades en términos porcentuales, el lado derecho de la igualdad es una expresión decimal en tanto que la del lado izquierdo es un porcentaje, por eso para igualar las unidades es necesario multiplicar el lado derecho por 100% lo que da lugar a la expresión proporcional propuesta por Sebastián:

%(

noB y noE

)

%( noE / noB )

  • x 100%

Figura 2. Sebastián aplica la regla de tres para hallar el valor de una marginal y

Figura 2. Sebastián aplica la regla de tres para hallar el valor de una marginal y llenar completamente la tabla.

En otras palabras, lo que Sebastián hace es asumir como universo los estudiantes que reprobaron biología y requiere calcular el porcentaje que representan éstos en el total de estudiantes: se conoce el porcentaje de los que perdieron español y biología, para conocer el porcentaje de los que solo perdieron biología lo relaciona con el 100% que es el porcentaje que se corresponde con los que perdieron biología respecto a ellos mismos. Dicho de otra forma, el argumento de Sebastián toma la forma:

“¿Cuánto es el total si lo que se tiene representa el 78% de ese total?”. Esta estrategia de regla de tres utilizada por Sebastián y otros dos estudiantes, estrecha aún más la cercanía que existe entre problemas de probabilidad condicional y problemas aritméticos con

porcentajes (que de acuerdo a los resultados de la segunda fase son más asequibles a los estudiantes) y que podría ser una opción didáctica para la enseñanza de este complicado tema. Los resultados obtenidos con estos dos problemas permiten observar que los formatos de frecuencia naturales no tienen un efecto uniforme en la resolución de los problemas de probabilidad condicional y que dependen, entre otras cosas, de las relaciones entre los valores dados. En este caso la información condicional dada en la forma “de cada 100 que están en A, n también están en B”, indujo a los estudiantes, que utilizaron tabla de doble entrada, a utilizar porcentajes dado que la información suministrada no permite obtener valores enteros. También se observa que si los estudiantes implementan la estrategia de llenar la tabla de doble entrada a como dé lugar, las diferencias en los niveles de dificultad que pudieran existir asociadas al tipo de pregunta que se realice pareciera que se desvanecen, La Tabla 2 da cuenta de los porcentajes de éxito así como los correspondientes a las equivocaciones más comunes y al uso de diversas representaciones en los problemas de la fase tres. En este caso, la confusión entre probabilidad condicional y probabilidad conjunta se presentó mucho más en el problema dado en frecuencias naturales que en porcentajes: 24% vs. 4%. La expresión “de cada 100 estudiantes que no aprobaron biología 78 tampoco aprobaron español” del problema 1 indujo más la confusión mencionada que la expresión del problema 2 “la probabilidad de que un estudiante juegue baloncesto entre los que no juegan fútbol es 45%”. Lo contrario se presentó en la confusión entre una probabilidad condicional y su inversa: 4% para el problema 1 y 16% para el problema 2. En cuanto a las representaciones utilizadas, además de lo ya previamente comentado respecto al uso mayoritario de las tablas de doble entrada, los estudiantes también utilizaron las otras representaciones consideradas: en alto porcentaje la algebraica en el problema 2 (24%), en bajos porcentajes el diagrama de árbol (8%) en ambos problemas y prácticamente inexistente los diagramas de Venn (0% y 4%).

Tabla 2. Problemas de la Tercera fase.

25 Estudiantes

RESPUESTA

 

Problema 1

Problema 2

Respuesta correcta

24%

48%

No respondió

28%

32%

Confunde probabilidad condicional y conjunta

24%

4%

Confunde una probabilidad condicional con su inversa

4%

16%

REPRESENTACIONES

Tabla de doble entrada

52%

44%

Álgebra o aritmética

2%

24%

Diagrama de Venn

0%

4%

Diagrama de Árbol

8%

8%

5.

CONCLUSIONES

De acuerdo con los resultados obtenidos, se concluye que la principal dificultad al resolver un problema de probabilidad condicional es la probabilidad condicional en sí misma, sin importar si ésta aparece en la parte informativa o en la pregunta del problema. Definitivamente la probabilidad condicional es un concepto que los estudiantes no terminan de entender, dificultad que se ve claramente reflejada en el momento de identificarlas en un problema o de relacionarla con las intersecciones y las marginales. El tipo de información presentada es un elemento definitorio de la dificultad que presenta un problema de probabilidad condicional. Más que el formato en que se presenta la información, la dificultad de un problema de probabilidad condicional radica en el tipo de información presentada. Esta investigación respalda la conjetura de Yáñez (2001) cuando dice que la dificultad de estos problemas guarda estrecha relación con el número de probabilidades condicionales que contenga en su parte informativa. Los resultados de este estudio no son concluyentes sobre la dificultad adicional que pueda representar proponer una pregunta condicional en lugar de una intersección o una marginal, parece ser que lo complicado es la condicional sin importar si está en la información o en la pregunta. Tal como lo muestran los resultados de la Tabla 1, los formatos de presentación tienen un efecto sobre el éxito al resolver el problema. En el caso 2, los resultados pocas dudas dejan sobre este aspecto:

mejores resultados con el formato de frecuencias, seguido por los porcentajes y luego las probabilidades. En el caso 5, ocurrió lo contrario, cuando se indagaba por probabilidades conjuntas o marginales se comportaron mejor los formatos de probabilidad que los porcentajes. Queda para estudiar con mayor detalle el efecto conjunto del formato y la pregunta realizada sobre el éxito al resolver un problema de probabilidad condicional. El poco efecto del formato utilizado en la solución de problemas caso 5 encontrado en esta investigación no va en contradicción con los resultados obtenidos por Gigerenzer y Hoffrage (1995), quienes concluyeron que las frecuencias naturales mejoraban los porcentajes de respuestas correctas de manera considerable. Simplemente se trata de problemas distintos, mientras ellos trabajaron exclusivamente con problemas de caso 7 (i), este estudio se centró en problemas de casos 2 y 5. En resumen, esta investigación refuerza la conjetura de que la bondad de los diversos formatos está relacionada con el tipo de problema, esto es, con la información dada. Para el caso 5, cuando la información condicional se presenta con relación a 100 casos (Ver problema 1 de la Fase 3), se presentó una nueva variable en juego: la viabilidad de transformar los porcentajes en números enteros. Como evidencia de lo anterior, en la fase 3 ocurrió que los estudiantes obtuvieron mejores resultados con el formato de porcentajes (problema 2) que con el formato de

frecuencias (problema 1). Interesante en esta fase el abordaje de algunos estudiantes que, para llenar la casilla de una marginal cuando se conoce una intersección y la condicional que la relaciona, utilizaron la información condicional y la intersección para proponer una regla de tres que les permitió resolver el problema. Este resultado refuerza la idea de que el mejor camino para enseñar probabilidad condicional podría ser la aritmética condicional. Se ratifica el alto porcentaje de estudiantes que confunden la probabilidad condicional con la probabilidad conjunta. Sin diferencias de casos o de formato, los porcentajes de confusión son muy altos. Esta confusión se muestra independiente tanto del tipo de problema como del formato en que se presente la información. Las representaciones constituyen una herramienta importante a la hora de resolver un problema de probabilidad condicional y su utilidad está en saber escogerla, ya que hay representaciones apropiadas dependiendo del tipo de información que se da. El análisis de las representaciones usadas por los estudiantes evidenció la poca capacidad que tienen para discriminar entre la representación apropiada, pues con mucha facilidad utilizaron diagramas de Venn para representar información condicional. Para superar estas dificultades los estudiantes deben ser entrenados en el uso de la tabla y el árbol, conocer sus ventajas y el tipo de problema que mejor se les ajusta. Para esta instrucción, análisis como los de Yáñez (2001) son indispensables para contrarrestar la idea que pueden tener muchos estudiantes y, posiblemente, algunos profesores, de que el diagrama de árbol es la mejor herramienta para resolver cualquier tipo de problema de probabilidad condicional, pero esto sólo se puede hacer cuando se enseñan diferentes tipos de problemas. Adicional a los interrogantes y vacíos que deja esta investigación, que seguramente exigirán nuevas metodologías de indagación, es recomendable extenderla a los demás casos de la clasificación de Yáñez (2001) que no fueron contemplados en este estudio.

REFERENCIAS

Ávila, R., (2001). Hacia una apropiación operatoria de la estocástica: El caso de la probabilidad condicional. Tesis de doctorado, Cinvestav-IPN, México.

Carles, M., Cerdán, F., Huerta, M.P., Lonjedo, M.A., Edo P. (2009). Influencia de la estructura y del contexto en las dificultades de los problemas de probabilidad condicional de nivel No. Un estudio exploratorio con estudiantes sin enseñanza previa. En M.J. González, M.T. González y Murillo (Eds.). Investigación en Educación Matemática XIII (pp. 173-185). Santander: SEIEM.

Cosmides, L., Tobby, J. (1996). Are humans good intuitive statistician after all? Rethinking some conclusions from the literature on judgment under uncertainty. Cognition, 58, 1-73.

Díaz, C., De la Fuente, I. (2005). Razonamiento sobre probabilidad condicional e implicaciones para la enseñanza de la estadística. Épsilon 59, 245-260.

Díaz, C. De la Fuente, I. (2006). Dificultades en la resolución de problemas que involucran el teorema de Bayes, un estudio exploratorio en estudiantes españoles de psicología. Educación matemática:

Vol.18, 75-94.

Díaz, C., Ortiz, J., Serrano, L. (2007). Un estudio experimental de las dificultades de los estudiantes en la aplicación del teorema de Bayes. XI simposio de la Sociedad Española de Investigación en Educación Matemática. La Laguna, España, p. 199-208.

Dupuis C., Rousset-Bert, S., (1996). Arbres et tableaux de probabilité: analyse en termes de registres de représentation. Repères-IREM, N0. 22, 51-72.

Eddy, D., (1982), Probabilistic reasoning in clinical medicine: Problems and opportunities. En Kahneman, D., Slovic., P., Tversky A., (eds.) Judgment under uncertainty: Heuristics and biases 249 – 267. Cambridge University Press.

Estrada, A., Díaz, C., De la Fuente, I. (2005). Un estudio inicial de sesgos en el razonamiento sobre probabilidad condicional en alumnos universitarios. X Simposio de la Sociedad Española de Investigación en Educación Matemática. En P. Bolea, M.J. Gonzáles y M. Moreno (Eds.). Huesca, España, p. 277-284.

Evans, J., Handley, S., Perham, N., Over D. y Thompson, V. (2000). Frequency versus probability formats in statistical word problems. Cognition 77, 197-203.

Falk, R. (1986). Conditional probabilities: insights and difficulties. II International Conference on Teaching Statistics. En R. Davidson y J (Eds.). Victoria, Canadá, p. 292–297.

Gigerenzer, G., Hoffrage, U. (1995). How to improve Bayesian reasoning without instruction:

Frequency format. Psychological Review, 102, 684-704.

Gigerenzer, G. , Hoffrage, U. (1999). Overcoming Difficulties in Bayesian Reasoning: A Reply to Lewis and Keren (1999) and Mellers and McGraw (1999). Psychological Review, Vol. 106, No. 2,

425-430.

Girotto, V., & Gonzalez, M. (2002). Chances and frequencies in probabilistic reasoning: rejoinder to Hoffrage, Gigerenzer, Krauss, and Martignon. Cognition, 84, 353–359.

Gras,

R.,

Totohasina,

A.

(1995).

Chronologie

et

causalité,

conceptions

sources

d’obstacles

épistémologiques à la notion de probabilité conditionnelle. Recherche en Didactique des Mathématiques, Vol. 15, No. 1, 49-55.

Hoffrage, U., Gigerenzer, G., Krauss, S. & Martignon, L. (2002). Representation facilitates reasoning:

what natural frequencies are and what they are not. Cognition, 84, 343-352.

Kahneman, D., Slovic P., Tversky A. (Eds.) (1982). Judgment Under Uncertainty: Heuristic and Biases. New York: Cambridge University Press.

Kahneman, D., Tversky A. (Eds.) (1982a). Evidential impact of base rates. En Kahneman, D., Slovic, P., Tversky, A., (eds) Judgment Under Uncertainty: Heuristic and Biases (1982), 153-160.

Lewis, C. & Keren, G. (1999). On the Difficulties Underlying Bayesian Reasoning: A Comment on Gigerenzer and Hoffrage. Psychological Review, 106, 411-416.

Lonjedo, M.A. (2007). Análisis de los problemas ternarios de probabilidad condicional de enunciado verbal y de sus procesos de resolución. Tesis doctoral publicada en la Universidad de Valencia. España.

Martignon, L. & Wassner, C. (2002). Teaching Decision Making and Statistical Thinking With Natural Frequencies. VI International Conference on Teaching Statistics. En B. Phillips (Ed.). Ciudad del Cabo, Sur África, p. 1-4.

Mellers, B. & McGraw, P. (1999). How to Improve Bayesian Reasoning: Comment on Gigerenzer and Hoffrage (1995). Psychological Review, 106, 417-422.

Ojeda, A. M. (1994). Understanding Fundamental Ideas of Probability at Pre-University levels. Tesis de doctorado no publicada. University of London.

Parzysz, B. (1990). Un outil sous-estimé: l’arbre probabiliste. APMEP, 69 (372), 47-54.

Pollatsek, A., Well, A., Konold, C. & Hardiman, P. (1987). Understanding Conditional Probabilities. Organization Behavior and Human Decision Processes, 40, 255-269.

Shaughnessy, J. M., (2002). Investigación en Probabilidad y Estadística: Reflexiones y orientaciones. Publicaciones CINVESTAV-IPN, México. Traducido por Ávila, R., Yáñez, G., del original Shaughnessy, J. M., (1992), Research in probability and statistics: reflections and directions. En Grows, D. (ed.), Handbook of research on mathematics teaching and learning, NCTM, 465-494.

Tversky, A., Kahneman, D.(1982). Causal schemas in judgment under uncertainty. En Kahneman, D., Slovic, P., Tversky, A., (eds) Judgment Under Uncertainty: Heuristic and Biases (1982), 117-128.

Vallecillos,

A.,

(1995),

Comprensión

de

la

lógica

del

contraste

de

hipótesis

en

estudiantes

universitarios. Recherches en Didactique des Mathématiques, Vol. 15, N° 3, 53-81.

Yáñez, G. (2001). El álgebra, las Tablas y los Árboles en Problemas de Probabilidad Condicional.

Iniciación a la investigación en didáctica de la matemática. Homenaje al profesor Mauricio Castro. En Gómez, P., y Rico, L. Granada, España, p. 355-37.

Yáñez, G. (2003). Estudios sobre el papel de la simulación computacional en la comprensión de las secuencias aleatorias, la probabilidad y la probabilidad condicional. Tesis doctoral no publicada. Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional, México.

EFECT OF THE TYPE OF INFORMATION AND THE DATA FORMAT IN CONDITIONAL PROBABILITY PROBLEM

ABSTRACT

We present in this paper the results of an investigation on the effect of the format and type of information on the responses and mistakes college students to solve some kind of binary problems (with two events and their complements) of conditional probability. The problems studied differ by the type of information presented: in one of them the information was two joint probabilities and marginal probability, while for the other information were two joint probabilities and conditional probability, and by the format. The questions posed relate to conditional probabilities and marginal intersections. The study was conducted with students of various specialties from the Universidad Industrial de Santander in Bucaramanga, Colombia. The results showed that the type of information, rather than the format used, has effects on problem solving. On the other hand, the study showed that the confusion between conditional probability and joint probability is refractory to both the format and the type of information, at least for the type of problems proposed.

Keywords: Conditional probability binary problem, type of information, presentation format and representations.

RESUMO

Apresentam-se neste trabalho os resultados de uma investigação sobre o efeito dos formatos e o tipo de informação sobre as respostas, os erros cometidos e as formas de representação em estudantes universitários ao resolver certa classe de problemas binários (com dois eventos e seus complementos) de probabilidade condicional. Os problemas aplicados diferenciam-se pelo tipo de informação que apresentam: em alguns deles a informação estava constituída por duas probabilidades conjuntas e uma probabilidade marginal, enquanto para outros a informação eram duas probabilidades conjuntas e uma probabilidade condicional, e pelo formato de apresentação: frequências naturais, percentagens e decimais. O estudo realizou-se com estudantes de diversas profissões da Universidade Industrial de Santander em Bucaramanga, Colômbia. Os resultados mostraram que o tipo de informação, mais que o formato utilizado, tem efeitos na resolução do problema. De outro lado, o estudo mostrou que a confusão entre probabilidade condicional e probabilidade conjunta é refractaria tanto ao formato como ao tipo de informação, ao menos para o tipo de problemas propostos. A representação algébrica foi a mais utilizada pelos estudantes.

Palavras chaves: Problema binário de probabilidade condicional; tipo de informação; formato de apresentação e representações.

Profesor

Titular

Universidad

Industrial

de

GABRIEL YÁÑEZ CANAL

Universidad Industrial de Santander, Colombia

Santander,

Bucaramanga,

gyanez@uis.edu.co

Colombia.

Licenciado

en

Matemáticas y Física. Magister en Matemáticas. Mestre en Estatistica. Doctor en Matemática Educativa.

ANA RÁTIVA HERNÁNDEZ Universidad Industrial de Santander, Colombia

mayuyao_4@hotmail.com

Profesora de Matemáticas en Educación a Distancia, Universidad Industrial de Santander, Bucaramanga, Colombia. Licenciada en Matemáticas.

DIANA LOZANO RODRÍGUEZ

Universidad Industrial de Santander, Colombia

dianalozano28@hotmail.com

Profesora de Matemáticas en el Colegio Agustiniano, Bucaramanga, Colombia. Licenciada en Matemáticas.

ANEXO 1. CUESTIONARIOS DE LA SEGUNDA FASE.

Grupo 1.

Problema 1. Caso 2. Formato de frecuencias. En un salón de clases con 50 estudiantes, 33 aprobaron biología. 15 aprobaron biología y español. 7 aprobaron español y no aprobaron biología. Calcule la probabilidad de que elegido un estudiante al azar de los que no aprobaron biología éste haya aprobado español.

Problema 2. Caso 2. Formato de probabilidades. En un salón de clases la probabilidad de que al seleccionar un estudiante al azar éste haya aprobado biología es 0.66. La probabilidad de que haya aprobado biología y español es 0.3. Se sabe además que la probabilidad de que un estudiante haya aprobado español y no haya aprobado biología es de 0.14. Calcule la probabilidad de que elegido un estudiante al azar de los que no aprobaron biología éste haya aprobado español.

Problema 3. Caso 2. Formato de frecuencias naturales. Pregunta condicional que exige calcular previamente el evento condicionante y el condicionado.

Un centro escolar con 1000 alumnos entre niños y niñas tiene 282 estudiantes que usan gafas, 147 niñas que las usan y 368 niñas que no las usan. Entre los niños ¿qué porcentaje usa gafas?

Problema 4. Caso 2. Formato de porcentajes. Pregunta de porcentaje condicional que se responde directamente con la información dada.

Para organizar un campeonato deportivo hemos preguntado a todos los inscritos si practican baloncesto y/o tenis. Se encontró que un 15% de los inscritos jugaban baloncesto y tenis, un 50% no jugaba ni baloncesto ni tenis y un 30% juega tenis. ¿Qué porcentaje de los que se sabe juegan tenis, juegan también baloncesto?

Grupo 2.

Problema 1. Caso 5. Formato de porcentajes. Pregunta marginal. De todos los alumnos de un instituto, el 30% de los estudiantes practican baloncesto y fútbol, el 30% practica baloncesto y no practica fútbol, de los que no practican baloncesto el 40% practica fútbol. ¿Qué porcentaje de estudiantes juega fútbol?

Problema 2. Caso 5. Formato de probabilidades. Pregunta de intersección. En un hotel la probabilidad de que elegido un huésped al azar éste practique tenis y golf es de 0.3 y la probabilidad de que practique tenis y no practique golf es 0.3. Si conocemos que la probabilidad de que elegido un huésped de los que no practican tenis este practique golf es 0.4. Calcule la probabilidad de que tomado un huésped al azar no practique ni tenis ni golf.

Problema 3. Caso 5. Formato de probabilidades. Pregunta condicional. En un salón de clase la probabilidad de que al seleccionar aleatoriamente un estudiante éste haya aprobado biología y español es de 0.3, y la probabilidad de que haya aprobado biología y no haya aprobado español es de 0.36. Se sabe además que (la probabilidad de que un estudiantes de los que no aprobaron español tampoco haya aprobado biología es 0.357) si se selecciona aleatoriamente un estudiante entre los que no aprobaron español la probabilidad de que éste no haya aprobado biología es 0.357. Calcule la probabilidad de que elegido un estudiante al azar de los que no aprobaron biología éste haya aprobado español.

ANEXO 2. CUESTIONARIOS DE LA TERCERA FASE

Problema 1. Caso 5. Formato de frecuencias. En un salón de clase de 50 estudiantes, 15 de ellos aprobaron biología y español y 19 perdieron tanto biología como español. Se sabe, además, que de cada 100 estudiantes que no aprobaron biología 78 tampoco aprobaron español.

  • (a) ¿Cuál es la probabilidad de que elegido un estudiante al azar de los que no aprobaron biología éste haya aprobado español.

  • (b) Calcule la probabilidad de que elegido un estudiante al azar, haya aprobado español.

  • (c) Calcule la probabilidad de que elegido un estudiante al azar haya aprobado biología y perdido español.

Problema 2. Caso 5. Formato de porcentajes.

En un colegio el 20% de los estudiantes juegan fútbol y no juegan baloncesto, el 30% no juega fútbol y practica baloncesto. La probabilidad de que un estudiante juegue baloncesto entre los que no juegan fútbol es 45%.

  • (a) Calcule la probabilidad de que elegido un estudiante al azar, juegue fútbol.

  • (b) Calcule la probabilidad de que elegido un estudiante al azar, juegue tanto fútbol como baloncesto.

  • (c) Calcule la probabilidad de que elegido un estudiante al azar, entre los que juegan fútbol juegue también baloncesto.

CAPÍTULO 3

LA UTILIZACIÓN DEL RAZONAMIENTO DEDUCTIVO EN EVENTOS MUTUAMENTE EXCLUYENTES Y EVENTOS INDEPENDIENTES

RESUMEN

ADRIANA G. D´AMELIO

Los conceptos de eventos mutuamente excluyentes y eventos independientes son fuentes de fenómenos didácticos. En efecto hemos constatado en los cursos de Probabilidad y Estadística en estudiantes universitarios que en las actividades en dónde intervienen dichos conceptos, los estudiantes muestran ideas espontáneas erróneas confundiendo ambos y asociándolos de manera incorrecta. El problema didáctico principal consiste entonces en alejar la atención de los alumnos del contenido y centrarla en la forma. Es decir la propiedad de independencia está presente con la regla del producto cómo la más aplicada, pero no se pueden separar del contenido semántico. Sería necesario entonces neutralizar el contenido semántico proponiendo encontrar el valor de verdad de proposiciones para lograr que disocie en un razonamiento la forma lógica y el contenido semántico. El objetivo es poner al alumno en situación de demostrar a través del razonamiento deductivo los objetos estadísticos puestos en juego. El marco teórico didáctico está basado sobre el razonamiento deductivo de Raymond Duval. La metodología de investigación es teórica-metodológica con un estudio de casos. El instrumento se aplicó a 97 estudiantes de la cátedra de estadística de la Facultad de Ciencias Económicas. Este trabajo pretende hacer un aporte a la enseñanza de la probabilidad del concepto de eventos mutuamente excluyentes y eventos independientes, para su mejor tratamiento en la sala de clase.

Palabras clave: Enseñanza de la estadística; razonamiento deductivo; eventos mutuamente; excluyentes y eventos independientes.

1.

INTRODUCCIÓN

Los conceptos de eventos mutuamente excluyentes y eventos independientes son fuentes de fenómenos didácticos. Los estudiantes universitarios que cursan Probabilidad y Estadística en las actividades en dónde intervienen dichos conceptos, muestran ideas espontáneas erróneas confundiendo ambos y asociándolos de manera incorrecta. Estos conceptos son sencillos o aparentemente simples en su definición pero sin embargo entrevistas a colegas reconocen que la confusión persiste en los alumnos universitarios. El fenómeno se da en carreras matemáticas y no matemáticas. Es por ello que nos preguntamos:

¿En el funcionamiento de un paso de deducción los estudiantes organizan las proposiciones según un estatus operatorio o según su contenido? El objetivo es poner al alumno en situación de demostrar a través del razonamiento deductivo los objetos estadísticos puestos en juego.

El instrumento se aplicó a 97 estudiantes de la cátedra de estadística divididos cuatro

grupos simultáneamente. Se implementó después de tratado el tema.

Se utilizó un problema inscrito en la unidad de probabilidad del programa institucional,

con el objeto de estudiar el razonamiento que desarrollan los estudiantes en las estrategias de

resolución.

En el análisis a priori se explica la respuesta experta y se analizan las posibles respuestas

de los estudiantes. En el análisis a posteriori se utilizó una tabla propuesta por Duval (1999)

para el estudio de textos dónde muestra el funcionamiento de los pasos de deducción que

realizan los estudiantes.

Este trabajo pretende hacer un aporte a la enseñanza de la probabilidad del concepto de eventos mutuamente excluyentes y eventos independientes, para su mejor tratamiento en la sala de clase.

  • 2. EL PROBLEMA DE INVESTIGACIÓN

Una de las mayores dificultades que presentan los estudiantes universitarios en el tema de probabilidad, es la definición de eventos mutuamente excluyentes y de eventos independientes. Si bien los conceptos de eventos independientes y mutuamente excluyentes son aparentemente sencillos las ideas espontáneas de las personas dan lugar a respuest as equivocadas. La confusión de los alumnos en estos conceptos es reconocida por la mayoría de los docentes de esta asignatura en distintas universidades de Argentina. En un cuestionario de probabilidad (Alarcón y Sánchez 1987) aplicado a 44 profesores de matemáticas con ciertos conocimientos de probabilidad y estadística, se les pidió que contestaran la siguiente pregunta:

Se extrae una carta al azar de una baraja americana: sea A el evento "se extrae trébol" y B el evento se extrae una reina". ¿los eventos A y B son independientes? Argumentar.

Se esperaba que calcularan las probabilidades de A, B y A B y observaran que satisface la regla del producto P (A B) = P(A).P(B). Sin embargo, esta sencilla operación sólo la realizaron correctamente 4 profesores. Fue la pregunta que tuvo el índice más bajo de respuestas correctas. Las respuestas incorrectas formaban patrones bien definidos:

Patrón de respuesta I: Creer que eventos independientes es lo mismo que eventos ajenos (o mutuamente excluyentes): No son independientes porque está la reina de trébol. Patrón de respuesta II: Creer que sólo se puede aplicar a sucesión de experiencias:Si extraemos una carta para verificar el evento A y se vuelve a colocar en la baraja para verificar el evento B,

entonces A y B son independientes. Si se extrae la carta para verificar A y no se regresa son dependientes. En los dos tipos de respuestas observamos que los sujetos adjudican la situación en un contexto asociando la palabra independencia incluyendo elementos cercanos a experiencias perceptivas o empíricas, relacionados con la realidad en el primer caso, relaciones temporales en el segundo caso. En observaciones de actitudes y respuestas a exámenes de mis alumnos universitarios de las carreras de contabilidad y ciencias políticas han indicado algunas de las ideas espontáneas que tienden a elaborar acerca de eventos independientes y mutuamente excluyentes en las diferentes situaciones en las que esta noción entra en juego, pero no se sabe en detalle que relación guardan estas concepciones con las definiciones formales. Algunas hipótesis:

1. Es usual la confusión que asocia ajeno a independientes, y sólo si uno de ellos es vacío se cumplen ambas. 2. La independencia se confunde con experiencias independientes. Sin que se expliciten la diferencia entre ambas nociones. 3. La confusión se debe a la causalidad. Nuestras hipótesis para explicar los errores son que podrían provenir de:

Olvido de los conceptos de independencia y de eventos ajenos.

Confusión en la terminología

Poco énfasis en la enseñanza de la diferencia entre eventos y experiencias independientes

Los formatos de los cuestionarios en los que se piden respuestas rápidas, los cuales probablemente inducen respuestas poco reflexionadas. Nos preguntamos:

¿En el funcionamiento de un paso de deducción los estudiantes organizan las proposiciones según su estatus operatorio o según su contenido? El estatus depende de su contexto de enunciación, el cual determina las relaciones posibles con otras proposiciones.

  • 3. MARCO TEÓRICO

Dada la importancia de la semiótica en estas preguntas, hemos tomado como marco teórico a la teoría de las representaciones semióticas propuesta por Raymond Duval con su teoría sobre el razonamiento deductivo. Son pocos los estudios didácticos sobre estos temas y las propuestas diferentes para implementarlos.

3.1

EL ANÁLISIS FUNCIONAL DEL RAZONAMIENTO

El razonamiento es la expansión discursiva de proposiciones a partir de un enunciado de premisas que tiene por fin probar la verdad de un enunciado. Tiene el propósito de modificar el valor epistémico, semántico o teórico, que el enunciado-objeto tiene en un estado de conocimiento dado, o en un medio social dado y en consecuencia de modificar el valor de verdad cuando se cumplen las condiciones particulares de una organización del discurso. Las dos características necesarias del razonamiento para que sea reconocido como tal son:

Estar orientado hacia la proposición a justificar

Estar centrado sobre el valor lógico o epistémico de esta proposición y no en su contenido.

Para Duval:

“El funcionamiento cognitivo del razonamiento depende en primera instancia de la interacción de los tres componentes del sentido de las proposiciones enunciadas en el razonamiento 1) el contenido semántico, 2) el valor lógico de verdad y 3) el valor epistémico o social”. El contenido semántico es lo perteneciente o relativo a la significación de las palabras, en cambio el valor epistémico: es el grado de fiabilidad que posee lo que se enuncia en la proposición. Cuando un contenido se aprehende puede parecer evidente, cierto o sólo verosímil, plausible o simplemente posible, imposible o incluso absurdo. Esto depende del estado de los conocimientos que dispone el sujeto y/o del medio socio-cultural en el que se mueve. La comprensión de una proposición implica la determinación del valor epistémico de su contenido. Para que se explicite el valor epistémico de una proposición, es necesario que haya un conflicto cognitivo. Tal conflicto no surge sólo en presencia de una contradicción lógica entre dos proposiciones, sino en la presencia de una elección de valores epistémicos para una misma proposición. Este conflicto puede ser más fuerte cuando los valores epistémicos pueden ser tan extremos como evidentes y absurdos. El valor lógico: verdadero o falso. A diferencia del epistémico el lógico no depende sólo de la comprensión de su contenido sino que resulta de procedimientos específicos de verificación. El valor epistémico de una proposición y su valor de verdad, no proceden de los mismos procesos de determinación: uno procede de la comprensión del contenido y el otro de los procedimiento lógicos. Una proposición enunciada no tiene solamente un sentido, ella tiene también un estatus que depende del contexto de enunciación.

Proposición enunciada Estatus Teórico Operatorio Definición Axiom a
Proposición enunciada
Estatus
Teórico
Operatorio
Definición
Axiom a

Hipótesis

Sentido Contenido Valor semántico Epistém ico Valor Lógico
Sentido
Contenido
Valor
semántico
Epistém ico
Valor
Lógico
Pas aje Premisa- C onclusión Directa
Pas aje
Premisa-
C onclusión
Directa

Tercer Enunciado

Razonam iento deductivo
Razonam iento deductivo

Fi g.1 Sentido y estatus del razonamiento

El marco teórico formal funciona como un contexto global. Es un conjunto de proposiciones que tienen un estatus teórico de: definición, axioma, regla, hipótesis, teorema, etc. Una proposición no puede ser enunciada en un marco teórico sin tomar una de ellas. Estas determinan su organización y sus posibilidades de desarrollo. Por otra parte en la proposición enunciada es importante la organización de pasos de razonamiento. Cada paso funciona como un contexto local y se caracteriza a su vez por un conjunto de estatus operatorios que determinan su organización interna y las posibilidades de funcionamiento. Un razonamiento se caracteriza, por tener un conjunto de estatus en un contexto de enunciación teórico u operatorio que es lo que determina su funcionamiento. Además Duval afirma que:

“La organización de un paso del razonamiento deductivo requiere que el pasaje de las premisas a la conclusión se haga a través de una tercera proposición” (que llamaremos de ahora en más tercer enunciado) El análisis funcional del razonamiento hace la distinción estricta entre el valor epistémico de una proposición y su valor de verdad, distinciones claves para una definición del razonamiento. En el contexto de un enunciado la proposición tiene un valor epistémico teórico prioritario al contenido. Un razonamiento válido presupone la toma de conciencia que el valor epistémico teórico sustituye el semántico.

Contenido

Proposición Contexto de enunciación
Proposición
Contexto de enunciación
Antes Valor epistémico Semántico Verosímil o posible o neutro o evidente o absurdo o……… Verdadero, falso
Antes
Valor
epistémico
Semántico
Verosímil
o posible
o neutro
o evidente
o absurdo
o………
Verdadero, falso o
Indeterminado
Global Local Antes Durante Después Estatus Estatus Valor teórico operatorio epistémico teórico Hipótesis Premisa Axioma Tercer-Enunciado
Global
Local
Antes
Durante
Después
Estatus
Estatus
Valor
teórico
operatorio
epistémico
teórico
Hipótesis
Premisa
Axioma
Tercer-Enunciado
Definición
(operación de
Teorema
extracción)
Conjetura
Conclusión del
Necesario,
pregunta
Paso
apodíctico
Enunciado-obj eto
Valor de verdad
Verdadero

Fig 2: Transformación del valor epistémico teórico y por tanto del sentido de una proposición en el funcionamiento del paso de deducción , el cual pone en juego por lo menos “tres proposiciones”

En el funcionamiento del paso de deducción se parte (antes) del contenido de un enunciado con un valor epistémico semántico, que en el contexto global de enunciación tiene un estatus teórico, luego (durante) adquiere un estatus operatorio en dónde el pasaje de las premisas a la conclusión se realiza a través del tercer enunciado y termina (después) con el valor epistémico teórico. En general para los estudiantes sólo hay un valor epistémico inducido por la comprensión del contenido de la proposición. Este valor epistémico semántico los estudiantes lo asocian al valor lógico de verdad.

  • 3.2 LA DEDUCCIÓN: ESTATUS OPERATORIO Y RECURSO A UN TERCER ENUNCIADO

Las proposiciones, enunciadas en un contexto teórico, tienen un estatus teórico que determina su estatus operatorio en la organización de un paso de razonamiento El funcionamiento de un paso de deducción se define de la regla modus ponens o de implicación. Un paso de deducción se organiza en función del estatus operatorio de las proposiciones. Este estatus no depende del contenido de las proposiciones, de lo que ellas enuncian o significan, sino del estatus teórico fijado preliminarmente: hipótesis, teorema, definición, etc. Las premisas son hipótesis dadas al inicio (o conclusiones obtenidas en pasajes anteriores) y los terceros enunciados se toman de un cuerpo (definiciones, teoremas) construido teóricamente y deben tener un estatus teórico preciso. Esto significa que se deben aceptar sin discusión ya que pertenecen al

marco teórico en juego. El tercer enunciado funciona como operación de extracción implícita y no como justificación. El tercer enunciado teórico conforma dos partes funcionalmente distintas: una de proposición(es) antecedentes que deben verificarse, y otra de proposición consecuente que debe

extraerse. Esta organización interna de un enunciado se expresa a través de “si

entonces…”

. Esto

.. quiere decir que el tercer enunciado debe leerse como la articulación de dos partes, la primera de las cuales corresponde a una operación de verificación y la segunda a una operación de extracción. Cuando las hipótesis o conclusiones anteriores son proposiciones antecedentes del tercer enunciado la proposición consecuente tiene estatus de conclusión. En este sentido el funcionamiento del paso de deducción tiene un carácter algorítmico. En la figura 3 se muestra la organización de un paso que funciona según el modus ponens. Para poder aplicar el teorema todas las proposiciones antecedentes que forman la parte condición deben verificarse y darse en las hipótesis iniciales o haber sido obtenidas en conclusiones anteriores. Estas se constituyen en las premisas del paso. Luego de la verificación, la proposición consecuente se extrae como conclusión.

Tercer- Enunciado

Si dos segmentos son (1) paralelos y (2)tienen la misma longitud entonces sus extremidades son los vértices de un paralelogramo

marco teórico en juego. El tercer enunciado f unciona como operación de extracción implícita y no
marco teórico en juego. El tercer enunciado f unciona como operación de extracción implícita y no
marco teórico en juego. El tercer enunciado f unciona como operación de extracción implícita y no

Verificaciones

(1) AB y CD son paralelos

(2) AB y CD tienen la misma longitud

Extracción

ABCD son los vértices de un paralelogramo

marco teórico en juego. El tercer enunciado f unciona como operación de extracción implícita y no

Premisas

Conclusión

Fig.3 Organización deductiva

La organización del paso de deducción impone la implicación, como conclusión y sólo el de esta parte, independientemente de cualquier interpretación del contenido de las premisas y de la conclusión. Un valor epistémico teórico se halla ligado al estatus teórico de cada proposición y no al contenido, puesto que cuando el valor epistémico no se funda sobre el estatus teórico sino sobre la comprensión del contenido de las proposiciones, se puede tener un conflicto sobre el valor epistémico de las proposiciones que justifican. “El razonamiento válido sólo considera el valor epistémico ligado al estatus teórico y la actitud discursiva depende del valor epistémico que deriva de la componente del contenido”. En la organización deductiva (fig.3), es necesario dar reglas de construcción centradas en el estatus de las proposiciones:

De las hipótesis sale una flecha pero nunca llega una.

De un teorema sale una flecha, pueden llegar una o varias.

De la conclusión que se debe demostrar jamás sale una flecha. La graduación de la selección de respuestas se basa en el lugar de las proposiciones es decir en su estatus y no en el contenido de las mismas. La continuidad entre dos pasos de deducción está asegurada cuando se retoma una misma proposición: la conclusión del primer paso se retoma como premisa en el paso siguiente. Al retomarla, la proposición cambia de estatus operatorio. Ese tipo de encadenamiento presenta dos propiedades esenciales:

1. No necesita ningún conectivo proposicional 2. No implica ninguna continuidad temática. Los objetos a los cuales se refieren las premisas del primer paso pueden ser diferentes a los objetos que se refieren las premisas siguientes. El progreso del razonamiento se desarrolla sustituyendo la conclusión anterior por una nueva hasta la obtención del enunciado objeto. No es necesario retener el tercer enunciado ni las premisas de un paso para comprender los que siguen. Las restricciones de organización propias al funcionamiento del razonamiento deductivo no están vinculadas a ninguna forma lingüística. En efecto estas restricciones se basan en el estatus operatorio. Para la comprensión del razonamiento deductivo, la organización deductiva del discurso no puede hacerse verdaderamente más que a través de un registro distinto de la lengua natural, esta inferencia, no depende de su contenido sino únicamente de su forma. Es por ello que el razonamiento deductivo exige centrarse en el estatus de las proposiciones y neutralizar el valor epistémico semántico a favor de un valor epistémico teórico.

  • 3.3 EL RECONOCIMIENTO DE LA VALIDEZ DE UN RAZONAMIENTO DEDUCTIVO

Las premisas son independientes. La única restricción que hay, para permitir la operación de extracción, concierne a la organización interna del tercer enunciado donde se distinguen dos partes, una formada por las proposición (es) antecedente(s) y otra por la proposición consecuente. La conclusión para ser extraída debe estar inscrita en el tercer enunciado. Los alumnos no toman en cuenta las hipótesis o se contentan con verificar una sola condición. Si no comprende la importancia del estatus en la organización de un paso de deducción, una conclusión puede convertirse en hipótesis. Si no se percibe la validez de los pasos y de su encadenamiento, el razonamiento no provoca ninguna modificación en la aprehensión del sentido de las conclusiones obtenidas. No basta con que el razonamiento sea válido es necesario además que las proposiciones sobre las cuales se apoya sean

verdaderas. Una definición tiene la función de permitir la identificación de objetos reales, o simplemente posibles, sin que haya ningún riesgo de confundirlo con otros objetos. Esta función cognitiva de identificación no se cumple de la misma manera si el objeto que debe ser reconocido pertenece al universo del entorno, o si se inscribe en un conjunto complejo del marco teórico. Las definiciones que nos interesan son las llamadas “proposiciones primitivas”. Estas son tomadas de un cuerpo de proposiciones reconocidas como verdaderas y separan las proposiciones planteadas como primeras proposiciones para derivar deductivamente todas las proposiciones de ese corpus. Naturalmente estas “proposiciones primitivas” pueden conducir a la demostración de otras que no estaban en el corpus inicial. La prueba de aceptabilidad de una definición primitiva es que ella no introduce ninguna debilidad en una u otra demostración cuya cadena explicita el orden de derivabilidad deductiva del conjunto de proposiciones planteadas. El otro tipo de proposiciones que usaremos son las definiciones características: aquellas que entre las propiedades que entran en la descripción del objeto, seleccionan la que permite identificarlo de manera más económica. Su prueba de aceptabilidad es la rapidez de tratamiento en las situaciones en que este objeto debe ser reconocido.

3.4 APLICACIÓN DEL MARCO TEÓRICO AL PROBLEMA PROPUESTO PARA ESTA INVESTIGACIÓN

Situación problema:

Sea (S, P) un espacio de probabilidad, A y B sucesos de S tales que P(A)>0 y P(B)>0.Analice si la siguiente afirmación es V o F. En caso de ser V justifique y cuando sea F escriba la expresión correcta.

“Si A y B son mutuamente excluyentes entonces la probabilidad de que ocurra al menos uno de ellos está dada por P(A).P(B)”

verdaderas. Una definición tiene la función de permitir la identificación de objetos reales, o simplemente posibles,

Fig.4 Organización deductiva de la situación propuesta

3.5 ORGANIZACIÓN EN PASOS DE LA DEDUCCIÓN DE LA SITUACIÓN PROPUESTA

En la figura 5 se muestra el grafo proposicional de la demostración en la situación problema base de esta investigación. Cada flecha marca un paso del razonamiento. Las definiciones de partida DI, DII y DIII tienen estatus teórico de definición pertenecen al marco teórico en juego. En el paso 1 se concluye que A y B son Ø y AB =Ø estas resultan de las hipótesis de partida y son reutilizadas en el paso 2 como premisas de entrada que a través del tercer enunciado se obtiene la proposición consecuente con estatus de conclusión. Es decir P(A U B) = P(A)+P (B)

3.5 ORGANIZACIÓN EN PASOS DE LA DEDUCCIÓN DE LA SITUACIÓN PROPUESTA En la figura 5 se

DI, DII y DIII son las definiciones de partida

4.

METODOLOGÍA

La metodología de investigación que utilizamos es y sigue las siguientes etapas: el análisis exploratorio (concepciones de los alumnos), construcción del problema y análisis a priori, la experiencia, análisis a posteriori, confrontación de los análisis y conclusiónEl instrumento que se utilizó fue un problema inscrito en la unidad de probabilidad del programa institucional, con el objeto de estudiar el razonamiento que desarrollan los estudiantes en las estrategias de resolución.

4.1 ESTRUCTURA DEL PROBLEMA

Sea (S, P) un espacio de probabilidad, A y B sucesos de S tales que P(A)>0 y P(B)>0.Analice si la siguiente afirmación es V o F. En caso de ser V justifique y cuando sea F escriba la expresión correcta.

“Si A y B son mutuamente excluyentes entonces la probabilidad de que ocurra al menos uno de ellos está dada por P(A).P(B)”

  • a) Premisas (condición de entrada)

    • 1. (S, P) un espacio de probabilidad, A y B sucesos de S tales que P(A)>0 y P(B)>0

    • 2. A y B mutuamente excluyente.

  • b) Terceros enunciados involucrados:

Eventos mutuamente excluyentes definición : AB = Ø

Propiedad :P( A B )= 0

Propiedad P(A U B) = P( A ) + P ( B )

  • c) Conclusión:

Propuesta en el enunciado (contenido): P(A U B) = P( A ) .P ( B ) Valor Lógico: Falso

4.2 ANÁLISIS A PRIORI

4.2.1 Respuesta experta Respuesta correcta F Puesto que: Si A y B son mutuamente excluyentes entonces A B =Ø y P( A B )= 0 luego la probabilidad de que ocurra al menos uno de ellos está dada por P(A U B ) = P(A) + P(B)

4.1 ESTRUCTURA DEL PROBLEMA Sea (S, P) un espacio de probabilidad, A y B sucesos de

4.2.2

Posibles respuestas

  • 1. Una de las respuestas esperadas es :

A B =   la probabilidad de ocurrencia está dada por P(A).P(B) .

Es decir P ( A

B ) = P(A).P(B)

El estudiante usa un tercer enunciado incorrecto y le asigna la propiedad de independencia a los sucesos

  • 2. Un segundo tipo de respuesta

me P(A).P(B)=P(A B)=

y

son

Si

A

B

A

B

=

luego

P(A)=

1-P

(B)

ó

P(B)

=1

P(A) entonces

Además puede hacer la gráfica y representar en un diagrama de Venn. Este tipo de respuesta se diferencia de la respuesta experta por que el alumno considera a los conjuntos A y B sucesos complementarios del espacio muestral y en general no siempre ocurre.

  • 3. La tercera respuesta esperada es:

Si

son

mutuamente excluyentes entonces tiene que cumplirse al menos 1 de las siguientes

afirmaciones:

 

i)

P (A / B) = P (A).P(A)

0

ii) P (B/A) = P (B).P (B)

0

iii) P ( A

B )=P(A).P(B)

P (A / B)=

P

(

A B

)

x definición

 

(

P B

)

P (A / B)=

P

(

A P B

)

(

)

x ser mutuamente excluyentes

 

(

P B

)

P (A / B)= P ( A)

La probabilidad de que ocurra al menos uno de ellos

En

este tipo

de respuesta el alumno

utiliza premisas no pertinentes y concluye de manera

incorrecta.

4.3 EXPERIENCIA

El instrumento se aplicó a 97 estudiantes de la cátedra de estadística agrupados en cuatro comisiones simultáneamente. Se aplicó después de tratado el tema en clase. Del problema objetivo se analizó la producción escrita y si los estudiantes justifican siguiendo todos los pasos de la deducción.

De esas producciones sólo se analizaron 38 que son las que tenían valor de verdad Falso

(el correcto) pero justificadas de manera incorrecta ya que usaron diferentes recursos que no se

ajustan a la respuesta experta. Sólo 14 alumnos contestaron Falso y justificaron bien.

De esas producciones sólo se analizaron 38 que son las que tenían valor de verdad Falso

4.4 ANÁLISIS A POSTERIORI

A continuación se mostrarán las producciones de algunos alumnos que caracterizan los patrones de respuestas. Se seleccionaron sólo aquellas que más se repiten y tienen la misma intención de justificación. Tipo de justificación 1: Utiliza complementos para justificar No expresa la unión con el símbolo. Utiliza lenguaje natural para marcar los estatus. Supone sucesos complementarios que particionan el espacio muestral por eso

P( A ) = 1- P ( A )

De esas producciones sólo se analizaron 38 que son las que tenían valor de verdad Falso

Fig.7 Tipo de justificación 1

Tipo de justificación 2: Confunde la simbología P ( A B ) = y utiliza ejemplo numérico en la justificación. Escribe la definición de eventos mutuamente excluyentes en vez de

P ( A

B ) = 0 escribe P ( A

B ) =

Utiliza lenguaje natural para marcar los estatus. Da ejemplo numérico, expresa independencia entre sucesos. No expresa la probabilidad de la unión

Fig.8 Tipo de justificación 2 Tipo de justificación 3: Utiliza eventos complementarios divi diendo el espacio

Fig.8 Tipo de justificación 2

Tipo de justificación 3: Utiliza eventos complementarios dividiendo el espacio muestral en sólo dos sucesos. Utiliza lenguaje natural para marcar los estatus. Expresa sucesos complementarios que particionan

el espacio muestral por eso 1– P (A)=

P(B).

No expresa la probabilidad de la unión con el símbolo

Fig.8 Tipo de justificación 2 Tipo de justificación 3: Utiliza eventos complementarios divi diendo el espacio

Fig.9 Tipo de justificación 3

Tipo de justificación 4: Este alumno tiene la característica particular que utiliza conjuntos complementarios, ejemplo numérico y gráfico Escribe el enunciado. Expresa sucesos complementarios en el espacio muestral por eso 1– P (A)=P(B) Reutiliza premisas no pertinentes. Expresa la definición de eventos mutuamente excluyentes. Utiliza lenguaje natural para marcar los estatus. No expresa la probabilidad de la unión. Da ejemplo numérico Realiza un gráfico. Expresa independencia entre sucesos.

Fig.10 Tipo de justificación 4 Tipo de justificación 5: Utiliza lenguaje natural Expresa la probabilidad de

Fig.10 Tipo de justificación 4

Tipo de justificación 5: Utiliza lenguaje natural Expresa la probabilidad de que ocurra al menos uno de ellos como P(A).P(B) en vez de P(A U B) = P(A)+P(B). Escribe el enunciado. Expresa independencia entre sucesos. Emplea para marcar los estatus. No expresa la probabilidad de la unión en símbolos

verbos

Fig.10 Tipo de justificación 4 Tipo de justificación 5: Utiliza lenguaje natural Expresa la probabilidad de

Fig.11 Tipo de justificación 5

Tipo de justificación 6: Utiliza probabilidad condicional Escribe el enunciado Utiliza lenguaje natural para marcar los estatus. Escribe para que ocurra al menos uno de ellos P(A/ B) = P (A) o bien P (B/A )= P (B) expresando independencia en vez de la probabilidad de la unión de sucesos mutuamente excluyentes

Fig.10 Tipo de justificación 4 Tipo de justificación 5: Utiliza lenguaje natural Expresa la probabilidad de

Fig.12 Tipo de justificación 6

Tipo de justificación 7: Confunde símbolos y utiliza la regla de la adición No asigna el valor lógico de verdad

Escribe P (A

B )

=

en vez de P (A

B )

= 0

-71-

Fig.13 Tipo de justificación 7 4.4.1. Respuestas más utilizadas por los alumnos Las definiciones que utilizan

Fig.13 Tipo de justificación 7

4.4.1. Respuestas más utilizadas por los alumnos

Las definiciones que utilizan los alumnos para justificar su respuesta se caracterizaron en diez

tipos. Para ello se tuvo en cuenta las definiciones del objeto estadístico, tipo de premisas y conclusión.

  • 1- Escribe la definición de eventos mutuamente excluyentes

  • 2- Escribe la definición de eventos independientes

    • 3- Escribe P ( A

B ) =

  • 4- Expresa la probabilidad de la unión

    • 5- Escribe el enunciado

      • 6- Expresa sucesos complementarios que particionan el espacio muestral

        • 7- Utiliza lenguaje natural para marcar los estatus

          • 8- Realiza un gráfico

            • 9- Da un ejemplo

10- Usa la probabilidad condicional El gráfico siguiente expresa las frecuencias absolutas de las respuestas utilizadas por los alumnos.

Fig.13 Tipo de justificación 7 4.4.1. Respuestas más utilizadas por los alumnos Las definiciones que utilizan

Se puede observar que las respuestas más frecuentes son la 1, 2 y 7 de la que se deduce que los alumnos expresan de manera correcta las definiciones de eventos mutuamente excluyentes (1) y de eventos independientes (2). Para analizar los resultados se buscaron distintas metodologías, por un lado se hizo un análisis a priori del cual los alumnos utilizaron, como muestra la tabla resumen, las estrategias previstas. Los alumnos se clasifican en dos grupos de actitudes semejantes unos tienen claro el estatus operatorio de las premisas, utilizando el tercer enunciado con su estatus teórico fijado de antemano, los pasos de organización y la reutilización de las mismas; y el otro grupo se caracteriza por las marcas redaccionales del razonamiento deductivo. Usaron la mayoría de las premisas no pertinentes Se marcaron grupos de estudiantes con patrones de respuestas. Unos utilizaron el enunciado y luego justificaron para llegar a la conclusión. Casi nadie la expresó en símbolos, de los que la expresaron la hicieron a través del contenido del enunciado (la probabilidad de al menos uno de ellos). Pocos usaron ejemplos numéricos y otros diagrama de Venn. Otros usaron la probabilidad condicional para demostrar la ocurrencia de al menos uno de ellos. Y otros usaron sucesos complementarios.