semteek

Konkreetsushinnangud

Mis need on?

Abstraktsus ja konkreetsus moodustavad mõnes mõttes ühe skaala kaks otsa. Konkreetses skaala otsas asuvad kontseptid, mida on lihtne meeltega tajuda või ette kujutada. Näiteks “laud” ja “kass” kuuluvad pigem skaala konkreetsesse otsa,. Teises otsas on aga raskemini tajutavad või ettekujutatavad mõisted, näiteks “sõprus” ja “definitsioon”.

Kõigi sõnade puhul pole selge, kas tegu on konkreetsete või abstraktsete mõistetega. Mõned tunduvad olevat kuskil vahepeal: näiteks “valitsus” on ühelt poolt oluline ja abstraktne institutsioon, kuid sellegipoolest koosneb vägagi konkreetsetest inimestest. Samuti läheb asi pisut keerulisemaks siis, kui me ei räägi enam ainult nimisõnadest, nagu “kass” või “laud”, vaid näiteks tegusõnadest (“jooksma”, “aimama”), omadussõnadest (“krobeline”, “mõistetav”) ning määrsõnadest (“täna”, “vabalt”). Ka nende hulgas on sõnu, mis tunduvad teistest abstraktsemad või konkreetsemad, kuid nende puhul võib hindamine olla pisut keerulisem kui nimisõnade puhul.

Kas sõna teebki siis abstraktseks puhtalt see, kui inimene ei saa sõna kirjeldatud nähtust või asja näha, haista, kuulda ega katsuda (näiteks “sõprus”), ja konkreetseks see, kui tajumine on võimalik? Kanada professor Allan Paivio näitas tõepoolest juba 1965. aastal (20), et konkreetsed objektid tekitavad inimese peas mentaalseid pilte lihtsamini kui abstraktsed nähtused. See pole aga alati üksüheselt nii, et konkreetseid asju saab meeltega tajuda ja abstraktseid ei saa. Richardson (1976) tegi eksperimendi, mille tulemus näitab, et on enamjaolt tõsi, et kui objekt on konkreetne, siis on teda ka lihtne vaimusilmas ette kujutada, kuid mitte alati, ning seega ei saa konkreetsust ja ettekujutatavust päris samaks omaduseks pidada (21). Tema eksperimendis sai muuhulgas näiteks fraas “erutavad tunded” kõrge ettekujutatavuse hinnangu, kuid samal ajal peeti seda pigem abstraktseks. Samal ajal sai fraas “aktsiate rahaks tegemine” kõrge konkreetsushinnangu, kuid ei olnud sugugi nii lihtsasti vaimusilmas ette kujutatav. Seega pole abstraktsus ja ettekujutatavus väga lihtsalt ja üheselt kattuvad mõisted, kuid on siiski piisavalt sarnased, et inimene võiks hinnangu andmisel tajutavusest lähtuda.

Miks me neid vajame?

Konkreetsuse-abstraktsuse skaala on keeleteaduses ja psühholoogias kuum teema. Need kontseptsioonid on aja möödudes teaduses aina olulisemaks saanud, sest selleteemaliste artiklite arv kasvas u 300 pealt 1990ndatel 800 peale 2000ndatel ning 1900 peale viimasel kümnendil (3).

Konkreetsushinnangute andmestik on olemas paljudes keeltes. Näiteks on inimestelt hinnangud kogutud suurele hulgale ingliskeelsetele sõnadele (1), hollandikeelsetele sõnadele (2) ja mandariinikeelsetele sõnadele (3). Mitmes keeles on kogutud hinnanguid väiksemale hulgale sõnadele (1000-4000), sh prantsuse (4), saksa (5), itaalia (6), hispaania (7), portugali (8), poola (9), horvaatia (10) ja indoneesia (11) keele sõnadele. Lisaks inimesi hõlmavale katsemeetodile on neid väikeste mööndustega võimalik koguda ka masinõppe abil, eriti kui mingi hulk inimhinnatud sõnade andmeid on juba ees olemas (12, 19).

Andmestikke koostatakse, sest nende näol on tegu teadusvaraga, mida saavad oma töös kasutada mitme teadusharu esindajad. Esmajärjekorras on sellest palju abi keeleteadlastel, psühholingvistidel ja psühholoogidel. Konkreetsus ja abstraktsus mõjutavad seda, kuidas inimaju üldse keelt protsessib. Paljud teadlased töötavad teooriate kallal, mis püüavad seletada, miks konkreetsemaid sõnu on lihtsam protsessida kui abstraktseid (13, 14). Et ka eesti keele kohta selliseid uuringuid põhjalikumalt teha, on hädasti vaja teada, kui abstraktsed või konkreetsed uuringus kasutatavad sõnad on.

Samuti ei ole ilma nende hinnanguteta võimalik teha teatud tüüpi keelekatseid. Näiteks lasevad paljud katsed inimesel ekraanil olevaid objekte või teksti vaadata ning mõõdavad, kui palju aega neil reageerimiseks kulub. Et abstraktseid asju protsessib inimene alati kauem, tuleb katseid tehes pöörata tähelepanu sellele, et nähtavad objektid või sõnad oleks sarnase abstraktsustasemega, et katse tulemused sellest mõjutatud poleks.

Meie abstraktsuse-konkreetsuse hinnangutest võiks abi olla ka neuroloogias. Mõned teadlased on näidanud, kuidas abstraktsed ja konkreetsed sõnad mängivad erinevat rolli Parkinsoni tõve ja skisofreenia korral (15, 16). Huvitaval kombel paistab olevat nõnda, et kui Alzheimerit põdevad patsiendid kaotavad esmajärjekorras pigem abstraktset sõnavara, siis dementsust põdevate patsientide puhul võib esmalt kaduda just konkreetne sõnavara (17, 18).

Lisaks mainitud valdkondadele on need kategooriad üliolulised ka arvutiteaduses, eriti mis puutub keeletehnoloogiasse ja sellesse, kuidas arvuti inimkeelt protsessib ja toodab. Abstraktsuse-konkreetsuse hinnangud teevad võimalikuks näiteks teksti automaatse keerukuse hindamise ning automaatse teksti lihtsustamise, asesõnade mudeldamise, automaatsete lühikokkuvõtete tegemise ja metafooride automaatse tuvastamise. Aedmaa (2019) kasutas neid selleks, et õpetada arvutit ära tundma, kas sisestatud tekstis on sellised ühendverbid nagu “alla käima” mõeldud otseses tähenduses (“käis trepist alla”) või ülekantud tähenduses (“käis elus alla”). Lisaks on hinnanguid kasutatud ka psühholoogias, meedia- ja tarbijakäitumisuuringutes, tarkvara arendamisel, kirjandusuuringutes ning keele- ja teiste kognitiivhäirete uurimisel.

Kogumine

Inimene, kes räägib eesti keelt emakeelena, on täielikult pädev hindama, kui abstraktsed või konkreetsed on eestikeelsed sõnad, tuginedes vaid omaenda intuitsioonile. Hinnanguid sai anda meie katses skaalal 0-st 10-ni, kus 0 tähistab kõige abstraktsemat ning 10 kõige konkreetsemat. Meie skaala teeb eriliseks see, et valida saab ka täisarvude vahelisi murdarve, näiteks 4,3 või 8,8.

Kust hinnatavad sõnad tulevad?

Meie üldnimekirjas oli 40 000 sõna, mida võib laias laastus lugeda kõige tavalisemateks eesti keele sõnadeks. 40 000 on aga päris suur arv, mistõttu pääseb nende hulgas katsesse ka sõnu, mis tunduvad paljudele inimestele ebatavalised. Igaüks meist kasutab tõenäoliselt sellest nimekirjast igapäevaselt vaid väikest osa.

Sõnad on valitud enamjaolt Eesti keele koondkorpuse sagedasemate sõnade hulgast. Koondkorpus sisaldab umbes 250 miljonit sõna. Tegime neist sagedusnimekirja ning arvasime sellest välja mõned sõnad, mille abstraktsuse-konkreetsuse hinnangud ei saaks olema kuigi kõnekad. Nendeks on näiteks inimeste, firmade, teoste ja muu sellise nimed (kuigi olime sunnitud sisse jätma need, mis on samasuguse kirjapildiga nagu mõni tavaline nimisõna, nt Kalju ja kalju). Täiendasime koondkorpuse nimekirja Eesti keele spontaanse kõne foneetiline korpuse sagedusnimekirja abil, et sõnavalikud pisut tasakaalustada.

Kuidas me hinnangud kokku arvutasime?

Projekti tulemuseks on nimekiri, mis näitab, kui abstraktsed või konkreetsed on 40,000 kõige sagedasemat eestikeelset sõna. Et ükski inimene ei elaks 40 000 sõna hindamist üle, siis iga katses osaleja näeb enda ekraanil vaid 215 sõna, mis on 40 000-st sõnast juhuslikult valitud. Lõpuks, pärast erinevaid puhastuskuure sai kokku andmestik, kus umbes 36,000 sõnal olid hinnangud vähemalt üheksalt katseosaliselt. Sõnu hindas kas osalise või täielikult 3,007 inimest, mis teeb sellest ühe suurima arvu osalejatega eesti keele katse.

Viited

Brysbaert M., Warriner A. B., & Kuperman V. (2014). Concreteness ratings for 40 thousand generally known English word lemmas. Behavior Research Methods, 46(3), 904–911.
Brysbaert M., Stevens M., De Deyne S., Voorspoels W., & Storms G. (2014). Norms of age of acquisi- tion and concreteness for 30,000 Dutch words. Acta Psychologica, 150, 80–84.
Xu Xu, Li Jiayin. (2020). Concreteness/ abstractness ratings for two-character Chinese words in MELD-SCH. PLoS ONE 15(6).
Bonin P., Meot A., & Bugaiska A. (2018). Concreteness norms for 1,659 French words: Relationships with other psycholinguistic variables and word recognition times. Behavior Research Methods, 50(6), 2366–2387.
Lahl O., Göritz A. S., Pietrowsky R., & Rosenberg J. (2009). Using the World-Wide web to obtain large- scale word norms: 190,212 ratings on a set of 2,654 German nouns. Behavior Research Methods, 41 (1), 13–19.
Montefinese M., Ambrosini E., Fairfield B., & Mammarella N. (2014). The adaptation of the Affective Norms for English Words (ANEW) for Italian. Behavior Research Methods, 46(3), 887–903.
Guasch M., Ferre P., & Fraga I. (2016). Spanish norms for affective and lexico-semantic variables for 1,400 words. Behavior Research Methods, 48(4), 1358–1369.
Soares A. P., Costa A. S., Machado J., Comesaña M., & Oliveira H. M. (2017). The Minho Word Pool: Norms for imageability, concreteness, and subjective frequency for 3,800 Portuguese words. Behavior Research Methods, 49(3), 1065–1081.
Imbir K. K. (2016). Affective Norms for 4900 Polish Words Reload (ANPW_R): Assessments for valence, arousal, dominance, origin, significance, concreteness, imageability and, age of acquisition. Frontiers in Psychology, 7(JUL), 1–18.
Coso B., Guasch M., Ferre P., & Hinojosa J. A. (2019). Affective and concreteness norms for 3,022 Croatian words. Quarterly Journal of Experimental Psychology (2006), 72(9), 2302–2312.
Sianipar A., van Groenestijn P., & Dijkstra T. (2016). Affective meaning, concreteness, and subjective frequency norms for Indonesian words. Frontiers in Psychology, 7(DEC).
Aedmaa E. (2019). Detecting compositionality of Estonian particle verbs with statistical and linguistic methods. Ph.D thesis, University of Tartu.
Paivio, A. (1986). Mental representations: A dual coding approach. Oxford, UK: Oxford University Press.
Schwanenflugel, P.J., & Shoben, E.J. (1983).Differential context effects in the comprehension of abstract and concrete verbal materials. Journal of Experimental Psychology: Learning, Memory, and Cognition, 9, 82-102.
Bocanegra Y., Garcı´a A. M., Lopera F., Pineda D., Baena A., Ospina P., et al. (2017). Unspeakable motion: Selective action-verb impairments in Parkinson’s disease patients without mild cognitive impairment. Brain and Language, 168, 37–46.
Smirnova D., Clark M., Jablensky A., & Badcock J. C. (2017). Action (verb) fluency deficits in schizo- phrenia spectrum disorders: linking language, cognition and interpersonal functioning. Psychiatry Research, 257(May), 203–211.
Catricalà E., Della Rosa P. A., Plebani V., Vigliocco G., & Cappa S. F. (2014). Abstract and concrete categories? Evidences from neurodegenerative diseases. Neuropsychologia, 64, 271–281.
Joubert S., Vallet G. T., Montembeault M., Boukadi M., Wilson M. A., Laforce R. J., et al. (2017). Comprehension of concrete and abstract words in semantic variant primary progressive aphasia and Alzheimer’s disease: A behavioral and neuroimaging study. Brain and Language, 170, 93–102.
Köper M., Schulte im Walde S. (2016). Automatically generated affective norms of abstractness, arousal, imageability and valence for 350 000 German lemmas. Proceedings ofthe Tenth International Conference on Language Resources and Evaluation.
Paivio A. (1965). Abstractness, imagery, and meaningfulness in paired-associate learning. Journal of Verbal Learning and Verbal Behavior, 4-1, 32-38.
Richardson J. (1976). Imageability and concreteness. Bulletin of the Psychonomic Society, 7-5, 429-431.