Un approccio interdisciplinare alla Complessità Percettiva

Dipartimento di Psicologia Centro Interdipartimentale Tecnologia della Conoscenza Università degli Studi di Palermo

Maurizio Cardaci (cardaci@unipa.it)

Floriana A. Carmeci (floriana.carmeci@unipa.it)
Dipartimento di Psicologia Università degli Studi di Palermo

Sezione Computer Science - Dipartimento di Matematica ed Applicazioni Centro Interdipartimentale Tecnologia della Conoscenza Università degli Studi di Palermo Sezione Computer Science - Dipartimento di Matematica ed Applicazioni Università degli Studi di Palermo

Vito Di Gesù (digesu@math.unipa.it)

Marco Elio Tabacchi (tabacchi@math.unipa.it)

Abstract Adopting an interdisciplinary perspective, this paper describes two experiments, in which we derived from perceived time a measure of cognitive complexity, both in acoustic and visual domains. Then we compared elapsed time with independent physical measures of the input complexity. Our results support a strong correlation between the structural properties of stimuli and their subjective processing. The theoretical interest, as well as some potential applications of this integrated approach to complexity, is discussed. Sommario Adottando una prospettiva interdisciplinare, il presente contributo descrive due esperimenti nei quali abbiamo derivato dal tempo percepito una misura della complessità cognitiva, nel dominio sensoriale sia acustico che visivo. Abbiamo quindi confrontato le stime temporali con misure fisiche indipendenti di complessità dell’input. I nostri risultati confermano una forte correlazione tra le proprietà strutturali degli stimoli e la loro elaborazione soggettiva. Sono presi in considerazione l’interesse teorico e alcune possibili applicazioni di tale approccio integrato alla complessità.

Ornstein (1969) circa il rapporto tra complessità dello stimolo e tempo percepito, e riprendendo il lavoro di Treisman (1963), il Mental Clock Model (Cardaci, 2000) prevede che: - con stimoli complessi, il maggior impegno di risorse cognitive rallenterà l’andamento dell’orologio interno, inducendo il soggetto a sottostimarne la durata; - con stimoli semplici, per via del minor carico cognitivo l’orologio interno andrà più velocemente, inducendo il soggetto a sovrastimarne la durata. Tali predizioni, che consentono non soltanto di misurare la complessità cognitiva tramite i suoi effetti sulla percezione temporale ma anche di confrontarla con quella fisica, sono state testate realizzando due esperimenti. In entrambi, le stime temporali prodotte sono state messe a confronto con misure della complessità fisica degli stimoli, rispettivamente sonori (esperimento 1) e visivi (esperimento 2).

Esperimenti
In ciascuno dei due esperimenti qui riportati, la complessità fisica degli stimoli è stata determinata con criteri indipendenti a priori. Nell’esperimento 1, centrato sull’ascolto di brani musicali, è stato utilizzato un indice basato sulla “densità”, ovvero sulla maggiore/minore presenza di “eventi sonori” (Xenakis, 1963) nella tessitura del brano (Nattiez, 2002); nell’esperimento 2, consistente nella presentazione di immagini pittoriche, è stato utilizzato un modello matematico basato su funzioni entropico-fuzzy (Cardaci, Di Gesù, Petrou, Tabacchi, 2006).La presentazione degli stimoli, interamente gestita dal

Introduzione
Nelle Scienze dell’Informazione la complessità percettiva dipende da proprietà fisiche misurabili degli stimoli. Essa emerge come un fenomeno strettamente fisico, che può essere sottoposto ad un’analisi puramente sintattica svincolata dall’osservatore umano. Questi, dal canto suo, possiede una semantica della complessità, legata non solo alla propria storia socio-culturale, ma anche ai processi mentali tramite cui il suo sistema percettivo elabora l’informazione sensoriale. In proposito, a partire dalle intuizioni di

computer, comportava la selezione casuale e la riproduzione automatica di brani/immagini di diversa complessità. I partecipanti, del tutto all’oscuro degli scopi della ricerca, dovevano quindi rispondere ad una serie di domande generiche, che includevano quella, realmente cruciale, sulla durata stimata dell’input.In accordo con le previsioni del Mental Clock Model, i risultati dei due diversi esperimenti evidenziano che stimoli (sia visivi che uditivi) strutturalmente più complessi sono significativamente associati ad una sottostima della loro estensione temporale.

temporale suggerito dallo sperimentatore (0-180 sec.); peraltro, al fine di escludere ogni possibile fonte di distorsione, si è posta cura di indagare anche sull’eventuale familiarità del brano/motivo musicale proposto (che nessuno dei soggetti ha dichiarato di conoscere).I file sonori elaborati, in formato Midi, sono stati riprodotti attraverso il computer, in una stanza al riparo da interferenze esterne.

Risultati
Dall’analisi dei dati emerge un significativo effetto complessità sulla percezione temporale. Infatti, nella condizione “alta densità”, i soggetti tendono a sottostimare l’intervallo temporale definito dal brano ascoltato [valor medio 80 sec.], rispetto alla condizione “bassa densità”, nella quale, invece, si registra una tendenza a sovrastimare la durata [valor medio 158 sec.]. La relatività delle durate stimate è confermata dai seguenti biases nella corrispondenza tra unità di tempo fisico (1 sec.) e unità di tempo percepito: nella condizione “bassa densità” 1 sec. fisico corrisponde, infatti a ≈2.6 sec. percepiti; in quella “alta densità”, 1 sec. fisico corrisponde invece a ≈1.3 sec. percepiti. Peraltro, le suddette differenze tra le condizioni densità “bassa” vs. “alta” risultano altamente significative: l’analisi della varianza applicata alle stime temporali prodotte (ANOVA) ha evidenziato una forte correlazione interclasse ed una netta separazione tra le classi [F≈95; p<0.0001]. Tali risultati dimostrano che manipolando la densità musicale come indice di complessità, in condizioni di stima temporale, si ottengono gli effetti previsti dal Mental Clock Model: all’aumentare della complessità musicale, diminuisce la stima temporale.

Esperimento 1
Stimoli Musicali Nel presente esperimento, si è ipotizzato che la percezione del tempo, nell’ascolto di brani musicali, sia influenzata dalla complessità dello stimolo sonoro percepito. Per verificare tale ipotesi, abbiamo manipolato, come indicatore di complessità, il parametro “densità musicale” (Xenakis, 1963; Dowling & Harwood, 1986; Honing, 2005), cioè la maggiore o minore presenza di eventi sonori nella tessitura del brano (Nattiez, 2002), rilevandone gli effetti sulla stima temporale.

Metodo
Soggetti: hanno partecipato all’esperimento, su base volontaria, 40 soggetti (20 uomini e 20 donne, età media di 23 anni) di estrazione universitaria, del tutto ignari degli scopi della ricerca. Stimoli: Per l’elaborazione degli stimoli sonori, abbiamo utilizzato un software funzionante da music machine, attraverso il quale sono stati gestiti automaticamente tutti i parametri musicali di due versioni elettroniche delle “Variazioni Goldberg” (J.S. Bach, 1741-1742), il cui tema è stato variato in modo tale da incrementarne la densità. Tutte le altre variabili musicali (tonalità, ritmo, timbro, velocità di esecuzione, intensità etc.) e la durata effettiva dei brani (60 sec.) sono state mantenute costanti. I due file musicali ottenuti sono stati etichettati, rispettivamente, come V1 (bassa complessità) e V2 (alta complessità). Le partiture relative ad una sezione dei brani V1 e V2, dalle quali si evince la differenza in termini di densità musicale, sono presentate in Figura 1. Procedura: I partecipanti all’esperimento (N= 40) sono stati assegnati casualmente a due diversi gruppi (ns=20), rispettivamente associati all’ascolto del file V1 e del file V2. Ciascun soggetto, testato individualmente, è stato invitato ad ascoltare un brano musicale, a conclusione del quale è stato sottoposto ad una serie di domande generiche sul brano ascoltato, tra le quali è stata inserita la richiesta, realmente cruciale, di stimarne la durata, secondo un range

Esperimento 2
Stimoli Visivi Nel presente esperimento, si è ipotizzato che anche nel caso di stimoli visivi emergano gli effetti previsti dal Mental Clock Model. Immagini più complesse determinano un rallentamento del tempo percepito, laddove il contrario si verifica con immagini più semplici.Per verificare tali previsioni, abbiamo dapprima derivato una misura della complessità fisica di immagini dal modello matematico presentato più avanti. Per mezzo di tale misura, abbiamo poi ripartito un insieme di immagini pittoriche in due diverse categorie: immagini ad “alta complessità” vs. a “bassa complessità”.

Metodo
Soggetti: hanno partecipato all’esperimento, su base volontaria, 40 soggetti (20 uomini e 20 donne,

età media di 23 anni) di estrazione universitaria, del tutto ignari degli scopi della ricerca. Stimoli: dopo avere testato un ampio set di riproduzioni pittoriche, abbiamo selezionato 12 immagini (6+6), che il nostro algoritmo ha classificato come a “bassa” (categoria I) vs. “alta” (categoria II) complessità computazionale. Esempi delle immagini utilizzate sono presentati in Figura 2.Procedura: I partecipanti all’esperimento (N= 40) sono stati assegnati casualmente a due diversi gruppi (ns=20), associati all’osservazione di immagini appartenenti, rispettivamente, alla categoria I e II. Ciascun soggetto, testato individualmente, è stato invitato a sedersi dinanzi allo schermo in posizione comoda e rilassata, premere il tasto del mouse per dare inizio all'esperimento, osservare l’immagine riprodotta a video fino alla sua scomparsa. Per non influenzare i soggetti, nella presentazione del compito si è evitato accuratamente di menzionare termini riferiti a concetti temporali. Dopo il periodo di osservazione (60 sec.), ciascun soggetto è stato invitato a rispondere ad una serie di domande generiche sull’immagine osservata, tra le quali è stata inserita la richiesta cruciale di stimarne il tempo di presentazione. Si è avuta, altresì, cura di indagare sull’eventuale familiarità del contenuto pittorico proposto (che nessun partecipante ha riconosciuto). La selezione delle immagini presentate e la relativa riproduzione video sono state gestite in modalità casuale da un programma appositamente elaborato.

influenzano la percezione temporale, secondo la direzione ipotizzata dal Mental Clock Model.

Misure di complessità degli stimoli
Per determinare la complessità fisica degli stimoli abbiamo fatto ricorso a misure oggettive indipendenti: nel caso degli stimoli musicali il criterio formale utilizzato è stato quello della densità, come precedentemente riportato; nel caso delle immagini, in mancanza di un criterio formale predeterminato, abbiamo elaborato un modello basato su algoritmi real-time, al fine di garantirne l’implementabilità. Tali algoritmi sono stati applicati alle immagini usate per l'esperimento, in modo da consentire un confronto con le stime temporali. Operatori Locali e Globali: Considerando che il riconoscimento di una scena attiva meccanismi diversi secondo che si debbano analizzare le sue componenti o invece dare un giudizio complessivo (Renninger Walker e Malik, 2004), anche nella letteratura sulla visione artificiale si distinguono due tipi di operatori: locali e globali. Gli operatori globali vengono utilizzati per derivare proprietà generali associati a valori numerici (ad es. quanto un’immagine sia chiara o scura…), mentre quelli locali evidenziano elementi specifici (disegno curvilineo o rettilineo, presenza o assenza di figure umane, complesse tessiture o tinte piatte…). Operatori globali e locali si completano a vicenda: l'utilizzo di soli operatori globali tende a produrre ambiguità e difficoltà di classificazione, a causa della forte riduzione della quantità di informazione, mentre i risultati degli operatori locali mettono in evidenza proprietà dell'immagine che devono essere codificate per poter essere classificate. Il nostro modello utilizza sinergicamente operatori di entrambi i tipi. Come operatore locale abbiamo scelto la Trasformata Simmetrica Discreta DST (Di Gesù e Valenti, 1996). Il nostro sistema visivo tende com’è noto a concentrarsi sulle simmetrie: più punti di interesse sono presenti, più l'immagine richiede attenzione (Yarbus, 1961; Fournier et al., 1988). L'operatore DST evidenzia le zone dell'immagine nelle quali sono presenti elementi a forte simmetria radiale, basandosi sulle misure del momento assiale di un corpo intorno al suo centro di gravità. La DST calcolata su un pixel (x ≡ (i, j, gij )), per n assi è data da:
k DSTi,j = 1 − stddevk Ti,j

Risultati
Al pari dell’esperimento sugli stimoli sonori, anche dal presente studio è emersa una significativa distorsione della stima temporale al variare del carico cognitivo in relazione alla complessità fisica degli stimoli osservati. I soggetti cui sono state presentate le immagini appartenenti alla categoria II (alta complessità) hanno sottostimato l’intervallo temporale di osservazione [valor medio 63 sec.] rispetto a coloro ai quali sono state sottoposte le immagini appartenenti alla categoria I (bassa complessità) [valor medio 184.1 sec.]. La relatività delle durate stimate è confermata dai seguenti biases nella corrispondenza tra unità di tempo fisico (1 sec.) e unità di tempo percepito: nella condizione “bassa complessità” 1 sec. fisico corrisponde infatti a ≈2 sec. percepiti; in quella “alta complessità”, 1 sec. fisico equivale approssimativamente a 1 sec. percepito.Per verificare l’esistenza di un significativo effetto di distorsione, abbiamo applicato alle stime temporali prodotte l’analisi della varianza (ANOVA), che ha evidenziato una forte correlazione interclasse ed una netta separazione tra le classi [F≈85; p<0.0001]. Tale dato altamente significativo conferma che, così come per gli stimoli sonori, variazioni nella complessità fisica di stimoli visivi

· Ei,j

con: stddev deviazione standard per k = 0, . . . , n - 1, del momento di second’ordine relativo all’angolo αk = kπ/n; Cr disco digitale centrato sul pixel (i, j) di raggio r;

k Ti,j = (x,y)∈Cr (i,j)

[(x − i) sin αk − (y − j) cos αk ] · gx,y .
gx,y − gs,t for |x − s| + |y − t| = 1.

2

Discussione
La presente ricerca trae spunto, da un lato, dalla constatazione che nella letteratura psicologica manca un chiaro quadro teorico di riferimento sul rapporto tra carico cognitivo dello stimolo e percezione della sua durata, dall’altro dalla ravvisata necessità di elaborare, nell’ambito delle discipline dell’artificial sensing, un modello formale delle misure di complessità da utilizzare in chiave interdisciplinare come criterio comparativo oggettivo. A supporto delle predizioni del Mental Clock Model, nel primo esperimento i risultati confermano l’esistenza di un meccanismo significativo di alterazione della percezione temporale dipendente dalle variazioni del carico cognitivo. La durata del secondo percepito si attesta su 1.3 sec. nel caso del brano V2 (alta complessità), e su 2.6 sec. nel caso del brano V1 (bassa complessità). La distorsione temporale osservata si rivela in questo caso così forte da giungere a raddoppiare l’unità di tempo percepita. Tale sorprendente variazione di magnitudine induce ad interrogarsi sulla portata dei meccanismi neurofisiologici implicati.D’altra parte, ancora più evidente è l’effetto prodotto dalla complessità delle immagini nel secondo esperimento: infatti l’unità di tempo percepita corrisponde ad un periodo di 1 sec. per la condizione “alta complessità”, e di 3 sec. per “bassa complessità”. Tale dato fa supporre che gli stimoli visivi abbiano maggior pregnanza semantica rispetto a quelli sonori, ma questa ipotesi richiede ulteriori approfondimenti incentrati sull’utilizzo sinergico di input visivi e sonori, anche per esplorarne gli eventuali effetti di interazione.

Ei,j =
(x, y) ∈ ∂Cr (i, j) (s, t) ∈ ∂Cr+1 (i, j)

Il secondo operatore misura la relativa smoothness dell’immagine calcolando il gradiente medio tra due dischi digitali di raggio r ed r+1, con ∂Cr (i, j), (∂Cr+1 (i, j)) punti di frontiera di Cr (i, j), (Cr+1 (i, j)). Nel determinare il nostro indice di complessità siamo interessati non ad una risposta a logica binaria (come ad esempio, nel caso del riconoscimento di volti, “è una faccia, o non lo è”), bensì alla determinazione di quanto un'immagine sia complessa. Abbiamo scelto come operatore globale la funzione di distanza entropico-fuzzy (Di Gesù e Roy, 2000):
G0 (η) = − 1 × (ηlog(η) + (1 − η)log(1 − η) log(2)

una variante della funzione entropica introdotta da n 1 Termini (De Luca e Termini, 1972), con η = n i=1 |hi | , e hi i livelli di grigio dell’immagine, normalizzati nell’intervallo [0,1]. Go soddisfa i requisiti canonici di una funzione distanza, ed il problema della determinazione dell'indice di complessità di un'immagine è stato associato alla ricerca del grado di appartenenza all'insieme delle immagini complesse, ed a questo la distanza tra l'immagine e la più semplice immagine realizzabile nel nostro spazio delle variabili (nella fattispecie un'immagine completamente uniforme). La componente entropica assicura l'espansione del dettaglio di classificazione dove i valori formano un cluster più fitto, ovvero all'inizio della curva. In Tabella 1 sono riportati i risultati dell'applicazione alle immagini degli operatori locali e globali prescelti. In particolare, è riportato il valor medio ottenuto dalla funzione di distanza entropicofuzzy, applicata alle immagini di ogni categoria filtrate con l’operatore DST. Come si evince dal confronto, i risultati ottenuti sono molto ben correlati con la durata soggettivamente percepita delle immagini (come previsto dal Mental Clock Model la correlazione è negativa poiché a livelli più elevati di complessità corrispondono stime temporali più brevi). Possiamo quindi dire che, almeno nell'ambito limitato di questo esperimento, l'applicazione ad un’immagine dell'operatore locale DST, e la successiva applicazione dell'operatore globale di distanza entropico-fuzzy forniscono un risultato numerico comparabile col differenziale tra i tempi di esposizione allo stimolo percepiti dai soggetti.

Conclusioni
Ai fini di un approccio inter-disciplinare come quello tipico delle scienze cognitive, dal presente lavoro si possono trarre interessanti implicazioni, non soltanto teoriche, ma anche applicative: la conoscenza del modo in cui gli individui, in differenti condizioni di stimolazione sensoriale, percepiscono il trascorrere del tempo, potrebbe permettere di calibrare la complessità, ad esempio, di contenuti multimediali in ambienti digitali. A questo scopo, gli sviluppi futuri della ricerca potranno riguardare un affinamento degli strumenti di misurazione della complessità, ed una nuova verifica del Mental Clock Model centrata sullo studio dell’integrazione simultanea di stimoli semplici/complessi provenienti da diversi domini sensoriali.

Bibliografia
Block, R. A. (1974). Memory and the experience of duration in retrospect. Memory and Cognition, 2, pp. 153-160. Block, R. A. (1978). Remembered duration: effects of event and sequence complexity. Memory and Cognition, 6, pp. 320-326. Block, R. A. (1990). Models of Psychological Time. In R. A. Block (Ed.) Cognitive Models of Psychological Time, Lawrence Erlbaum Associates, Hillsdale, NJ, pp. 1-35. Burt, C. D. B. (1992). Reconstruction of the Duration of Autobiographical Events. Memory and Cognition, 20, pp. 124-132. Cardaci, M. (2000). The mental clock model. Studies on the estimation of time, in Buccheri R., Di Gesù V. e Saniga M. (a cura di), Studies on the Structure of Time: from Physics to Psycho(patho)logy, Kluwer Academic/Plenum Publishers, New York, pp. 2754 2760. Cardaci, M., Di Gesù, V., Petrou, M., e Tabacchi, M.E. (2006). Classifying image complexity: a fuzzy approach, LNAI3849, pp.305-311. De Luca, A., e Termini, S. (1972), Information and Control, 301. Di Gesù, V., e Roy, S. (2000). Fuzzy measures for image distance, in Masulli F., R., Parenti R., G. , e Pasi G. (a cura di), Advances in Fuzzy Systems and Intelligent Technologies, Shaker Publishing (NL). Di Gesù, V., e Valenti, C. (1996), Symmetry operators in computer vision. Vistas in Astronomy, Pergamon, 40 (4), pp. 461–468. Dowling, W.J., e Harwood, D.L. (1986). Music Cognition, Academic Press, London. Fournier, L.R., Eriksen C.W. e Bowd C. (1988), Multiple-feature discrimination faster than single feature discrimination within the same object?, Perception and Psychophysics, 60, pp. 1384-1405. Honing, H. (2005). Timing is tempo-specific. Proceedings of the International Computer Music Conference, UPF, Barcelona, pp. 359-362. Migliore, M., Messineo, L., e Cardaci, M. (2000). A model of the effects of cognitive load on the subjective estimation and production of time intervals. Biosystems, 58, pp. 187-193. Migliore, M., Messineo, L., Cardaci, M., e Ayala, G.F., (2001). Quantitative Modeling of Perception and Production of Time Intervals. Journal of Neurophysiology, 86. Nattiez, J.J. (2002), Enciclopedia della musica, Einaudi, Torino, II, pp. 171-84. Ornstein, R. (1969). On the experience of time, Penguin Books, New York. Poynter, W.D. (1983). Duration judgment and the segmentation of experience. Memory and Cognition, 11, pp. 77-82.

Renninger, L.W., e Malik, J. (2004), When is scene recognition just texture recognition?. Vision Research, 44, pp. 2301-2311.

Treisman, M. (1963). Temporal Discrimination and the indifference interval: implications for a model of the "internal clock". Psychological Monographs, 576.

Xenakis, I. (1963). Musiques formelles. Revue Musicale, 253-254, 9-229. Yarbus, A.L. (1961), Eye Movements and Vision, New York, Plenum. Zakay, D. (1980), The Evasive Art of Subjective Time Measurement, in Richard Block (a cura di), Cognitive Models of Psychological Time, Lawrence Erlbaum, NewJersey.

Figura 1. Stimoli sonori. I suoni contrassegnati con * propongono lo stesso pattern melodico, ma all’interno di tessiture musicali caratterizzate diversa densità di eventi sonori.

Figura 2. Stimoli visivi. Un campione delle immagini pittoriche utilizzate per l'esperimento. Da sinistra a destra, in ordine decrescente di complessità: categoria I (bassa complessità), Georges Braque, "Il Pesce Nero"; categoria II (alta complessità), Nicholas Poussin, "Il Ratto delle Sabine". Durante l'esperimento le immagini sono state proposte nei loro colori originali.

Tabella 1. I risultati dell'applicazione del modello matematico entropico-fuzzy alle immagini. Posto ad 1 il valore corrispondente alla categoria II, è evidente la corrispondenza con i valori ottenuti negli esperimenti. Categoria I Categoria II

stima durata

2.04

1

Sign up to vote on this title
UsefulNot useful