Datu vizuālās prezentācijas metodes. Vizualizācijas metodes

Viegli atpazīt sejas un uztvert bez grūtībām nelielas izmaiņas viņā. Amerikāņu matemātiķis Hermans Černovs 1973. gadā publicēja rakstu, kurā viņš izklāstīja koncepciju, kā izmantot šo spēju uztvert cilvēka seju, lai izveidotu piktogrammas. Tos parasti izmanto divos gadījumos: 1) ja nepieciešams identificēt raksturīgas attiecības vai novērojumu grupas un 2) ja nepieciešams izpētīt šķietami sarežģītas attiecības starp vairākiem mainīgajiem. Černova sejas ir vienas no visvairāk efektīvi veidi daudzdimensionālu datu vizualizācija un ļauj ērti novērtēt lielu skaitu to vienlaikus.

“No visām vizuālajām prasmēm cilvēkiem ir visattīstītākā spēja uztvert citu cilvēku sejas. Īpaša smadzeņu garozas daļa atpazīst seju, nosaka skatiena virzienu utt. Citas smadzeņu daļas (amigdala un insula) analizē sejas izteiksmi, bet daļa frontālās daivas prefrontālajā zonā un smadzeņu sistēma, kas atbild par baudas sajūtas novērtē tās skaistumu.

Katram novērojumam tiek uzzīmēta atsevišķa “seja”, kurā atlasīto mainīgo relatīvās vērtības tiek attēlotas kā atsevišķu sejas īpašību formas un izmēri (piemēram, deguna garums, uzacu leņķis, sejas platums). Tādējādi novērotājs var identificēt objektu vizuālās īpašības, kas ir unikālas katrai vērtību konfigurācijai.

Sejas parametri

Piemēram, var izmantot 18 parametrus: acu izmērs, zīlītes izmērs, zīlītes stāvoklis, acu slīpums, horizontāls acu stāvoklis, vertikāls acu stāvoklis, uzacu arka, uzacu blīvums, horizontāls uzacu stāvoklis, vertikāls uzacu stāvoklis, augšējā matu līnija, apakšējā matu līnija, kontūra sejas, matu tumšums, matu ēnojumu slīpums, deguns, mutes izmērs, mutes izliekums.

Saites

Hermanis Černofs (1973). "Seju izmantošana, lai grafiski attēlotu punktus K-dimensiju telpā." Amerikas statistikas asociācijas žurnāls 68 (342): 361-368
Soboleva A. G. Zināšanu kognitīvā vizualizācija, izmantojot Černova sejas

Wikimedia fonds. 2010. gads.

Sejas (filma)
Sejas pūlī

Skatiet, kas ir “Černova sejas” citās vārdnīcās:

Černova- savā laikā ļoti slavena Simferopoles teātra dramatiskā aktrise, mirusi Simferopolē 1877. gada 16. martā divdesmit gadu vecumā. Bez skatuves izglītības un bez atdarināšanas cienīgiem paraugiem,...... Lielā biogrāfiskā enciklopēdija

Černovs, vācietis- Vikipēdijā ir raksti par citiem cilvēkiem ar tādu pašu uzvārdu, skat. Černovs. vācietis Černovs Dzimšanas datums: 1923. gada 1. jūlijs (1923 07 01) (89 gadi) Dzimšanas vieta: Ņujorka Zinātnes nozare: Lietišķā matemātika, p ... Wikipedia

Fiziognomija- Šis ir raksts par neakadēmisku pētniecības jomu. Lūdzu, rediģējiet rakstu tā, lai tas būtu skaidrs gan no tā pirmajiem teikumiem, gan no turpmākā teksta. Sīkāka informācija rakstā un sarunu lapā... Wikipedia

Černofa sejas" sastāv no dažādu mainīgo vērtību kodēšanas īpašībās vai pazīmēs cilvēka seja. Šādas “sejas” piemērs parādīts 16.2. attēlā.

Rīsi. 16.2.

"Černova seja"

Katram novērojumam tiek uzzīmēta atsevišķa “seja”. Uz katras “sejas” mainīgo relatīvās vērtības tiek attēlotas kā atsevišķu sejas īpašību formas un izmēri (piemēram, deguna garums un platums, acu izmērs, zīlītes izmērs, leņķis starp uzacīm).

Informācijas analīze, izmantojot šo attēlošanas metodi, balstās uz cilvēka spēju intuitīvi atrast līdzības un atšķirības sejas vaibstos.

Attēlā 16.3. attēlā parādīta datu kopa, kuras katrs ieraksts ir izteikts kā “Černova seja”. Rīsi.

16.3.

Daudzdimensionāla datu attēla piemērs, izmantojot Černofa sekcijas
Pirms vizualizācijas metožu izmantošanas jums ir:
Analizējiet, vai ir jāattēlo visi dati vai kāda to daļa.

Izvēlieties attēla izmērus, proporcijas un mērogu. Izvēlieties metodi, kas visskaidrāk var attēlot datu kopai raksturīgos modeļus. Daudzi mūsdienīgi līdzekļi Datu analīze ļauj izveidot simtiem dažādu grafiku un diagrammu veidu. Tāpēc vizualizācijas metodes izvēle, ja lietotājs to veic neatkarīgi, nav tik vienkārša un viegla, kā varētu šķist no pirmā acu uzmetiena. Pieejamība

liels daudzums Rīkā nodrošinātie vizualizācijas rīki, ko lietotājs izmanto, var pat radīt neskaidrības.. Lai vizualizācijas rīks pildītu savu galveno mērķi - sniegt informāciju vienkāršā un cilvēka uztverei pieejamā formā, ir jāievēro izvēlētā risinājuma atbilstības likumi attēlojamās informācijas saturam un tā funkcionālajam mērķim. . Citiem vārdiem sakot, jums ir jāpārliecinās, ka, aplūkojot informācijas vizuālo attēlojumu, varat nekavējoties identificēt avota datu modeļus un pieņemt lēmumus, pamatojoties uz tiem.

Starp divdimensiju un trīsdimensiju rīkiem visplašāk zināmie ir līniju diagrammas, līniju, joslu, sektoru un vektoru diagrammas.

Ar palīdzību līniju grafiks Varat parādīt tendenci, nodot raksturlieluma izmaiņas laika gaitā. Lai salīdzinātu vairākas skaitļu sērijas, šādi grafiki tiek attēloti uz tām pašām koordinātu asīm.

Histogramma izmanto, lai salīdzinātu vērtības noteiktā laika posmā vai vērtību attiecības.

Sektoru diagrammas izmanto, ja nepieciešams attēlot attiecības starp daļām un veselumu, t.i. analizēt parādību sastāvu vai struktūru. Kopuma sastāvdaļas ir attēlotas ar apļa sektoriem. Sektorus ieteicams izvietot atbilstoši to izmēram: augšpusē - lielākos, pārējos - pulksteņrādītāja kustības virzienā to lieluma samazināšanas secībā. Sektoru diagrammas tiek izmantotas arī faktoru analīzes rezultātu attēlošanai, ja visu faktoru darbības ir vienvirziena. Šajā gadījumā katrs faktors tiek parādīts kā viens no apļa sektoriem.

Viena vai otra vizualizācijas rīka izvēle ir atkarīga no veicamā uzdevuma (piemēram, ir jānosaka datu struktūra vai procesa dinamika) un no datu kopas rakstura.

Černofa sejas - šī ir diagramma vizuālais attēlojums daudzfaktoru dati cilvēka sejas formā. Katra sejas daļa: deguns, acis, mute – atspoguļo konkrētajai daļai piešķirtā mainīgā vērtību (kopā 18).

Galvenā doma ir tāda, ka cilvēkiem ir ļoti dabiski skatīties uz sejām, jo visi cilvēki to dara katru dienu. Tāpēc datu analīze izrādās zināmā mērā “naturālistiska”. Salīdzinājumus ir viegli izdarīt, un novirzes ir viegli identificēt. Pat blondīnes var veikt daudzfaktoru analīzi ievērojamu daudzumu datus.

1981. gadā Bernhard Flury un Hans Riedwyl uzlaboja koncepciju un pievienoja Černova sejām asimetriju. Tādējādi mainīgo skaits dubultojās līdz 36.

Tātad katra seja ir 18 elementu masīvs, no kuriem katram ir vērtība no 0 līdz 1. Vērtība atbilst izskats atbilstošā sejas daļa. Pētāmo objektu parametri tiek samazināti līdz šīm vērtībām. Reālo datu galējās vērtības tiks pieņemtas kā 0 un 1. Viss pārējais atradīsies šajā intervālā. Pamatojoties uz iegūto masīvu, tiek konstruēta seja.

Vai zem griezuma

Šeit ir norādīti parametri, kas iestatīti sejai:

1. Acu izmērs
2. Skolēna izmērs
3. Skolēna pozīcija
4. Acs slīpums
5. Acs horizontālais stāvoklis
6. Vertikāls acu stāvoklis
7. Izliekta uzacis
8. Uzacu blīvums
9. Horizontāla uzacu pozīcija
10. Vertikāls uzacu stāvoklis
11. Augšējā matu līnija
12. Apakšējā matu līnija
13. Sejas kontūra
14. Matu tumsa
15. Matu ēnojumu slīpums
16. Deguns
17.Mutes izmērs
18.Mutes izliekums

Grūtības ir saistītas ar pareizo mainīgo saskaņošanu ar sejas daļām. Ja ir kļūda, svarīgi modeļi var palikt nepamanīti.

Flury sniedz piemēru veiksmīgai analīzei, izmantojot sejas. Viņš analizēja 100 īstās un 100 viltotās banknotes, pamatojoties uz apmales izmēra, polsterējuma un diagonāļu parametriem. Lūk, kas notika:

Kā atsevišķa grupa nepārprotami izcēlās viltotās banknotes. Tādējādi analīze ļāva identificēt dažādas objektu grupas.

Asimetrija ļauj skatīt objektus procesā. Otrais piemērs parāda dažādus parametrus pacientiem, kuriem tika piemērota ārstēšana. Kreisā puse Seja parāda parametru vērtības pirms, bet labajā - pēc ārstēšanas.

Skatiet, kā ir mainījies parametru stāvoklis. Var viegli saprast, kurš ir uzlabojies un cik labāk, pat neiedziļinoties pētāmo parametru būtībā.

Rakstu Daudzfaktoru datu grafiskā attēlošana ar asimetrisko seju palīdzību (autors Bernard Flury un Hans Riedwyl) var izlasīt vietnē JSTOR

Ja jums nav piekļuves, es varu jums to nosūtīt apmaiņā pret interesējošo saiti, par kuru es vēl nezinu.

Ilustrēsim pakotnes grafiskās iespējas . Mēs izmantosim nākamā bāze dati: pirmajā ailē ir datums (informācija tika reģistrēta 2 reizes mēnesī mēnesi), otrajā - Gazprom gāzes cenas Londonas preču biržā par pašreizējo dienu (dati ņemti no vietnes http://www.lme .com), otrajā - eiro maiņas kurss (http://www.audito.ru/rateofexchange).

1. tabula. Sākotnējie dati

Pārējās kolonnas satur fiktīvu informāciju. Mēs pieņemam, ka ir kāds nominālais mainīgais, kuram ir tikai divas vērtības -1 un 0 (kas parāda, piemēram, kāda faktora, kas ietekmē tirdzniecības rezultātus, esamību/neesamību) un kāds kategorisks mainīgais ar dabas vērtības 5, 6, 7, 8, 9 un 10 (ar to domāts, piemēram, Gazprom reitings). 6.-8.ailē ir norādīts minimālais, vidējais un maksimālais eiro kurss dienas laikā, bet 9.-11.ailē - kursa pieauguma, samazināšanās iespējamība un kursa saglabāšanās nemainīga. Protams, vērtību summa pēdējās trīs kolonnās ir vienāda ar 1 katram novērojumam.

Tabulā ir 25 novērojumi.

Sektoru diagrammas

Sāksim ar vienkāršākajiem grafikiem.

Sektoru diagramma ir viens no visbiežāk izmantotajiem grafiskajiem formātiem mainīgo proporciju vai vērtību attēlošanai

Ļaujiet, piemēram, savā pārskatā iekļaut diagrammu, kas parāda, cik ilgu laiku bija eiro maiņas kurss intervālos, kas vienādi ar astoto daļu no visa valūtas kursa diapazona. Ieejam modulī Grafika/2M diagrammas/sektoru diagrammas.

Uz cilnes Turklāt norādīsim mainīgo - Eiro maiņas kurss un kategoriju skaits ir 8. Var norādīt diagrammas veidu (2M,3M) un formu (aplis, elipse).

Grafiku parametru iestatīšana Sektoru diagrammas

Noklikšķināsim labi.

Mainīgā eiro maiņas kursa sektoru diagramma

Līniju diagrammas

Līniju diagrammās atsevišķi datu punkti ir savienoti ar līniju. Šie grafiki ir vienkāršā veidā jēgu secību attēlošana un izpēte. Trases tipa grafikus var izmantot, lai reproducētu trasējumu (nevis secību). Līniju diagrammas tiek izmantotas arī, lai attēlotu nepārtrauktas funkcijas, teorētiskos sadalījumus utt.

Mūsu gadījumā ir diezgan dabiski interpretēt datus otrajā un trešajā kolonnā kā laikrindas, tāpēc līniju diagrammas ir ļoti efektīvi līdzekļi vizualizācija.

Piemēram, pieņemsim, ka vēlamies vizuāli analizēt tirdzniecības rezultātu un eiro kursa izmaiņu dinamikas atšķirības. Lai to izdarītu, skrienam Grafika/2M grafiki/Līniju diagramma (mainīgajiem).

Uz cilnes Ātri mēs norādām mūs interesējošos mainīgos un grafika veidu - Kompozīts.

Izveidotais grafiks izrādīsies bezjēdzīgs:

Mainīgo lielumu līniju grafiks Gāzes cenas un eiro kurss

Iemesls ir skaidrs - eiro kursa svārstības ir niecīgas, salīdzinot ar tirdzniecības rezultātu svārstībām. Tāpēc mēs norādīsim cita veida grafiku - ar dubultu Y asi (tab Turklāt).

2M līniju diagrammu loga cilne Papildu

Veiksim vēl vienu izmaiņu. Uz cilnes Iespējas1 norādīsim grupā Displeja opcijas kā novērošanas marķieris Mainīgs, un kā mainīgais - datums.

Noklikšķināsim labi.

Grafiks ar mainīgo lielumu dubulto Y asi Gāzes cenas un eiro maiņas kurss.

Voronoi diagramma

Īpašs izkliedes diagrammu gadījums ir Voronoi diagramma

Šis konkrētais viena mainīgā izkliedes diagramma ir vairāk analītisks rīks, nevis tikai metode datu grafiskai attēlošanai. Tās risinājumi palīdz modelēt dažādas parādības dabas un sociālajās zinātnēs (sk. Coombs, 1964; Ripley, 1981). Programma sadala telpu starp datu punktiem, kas attēloti ar X, Y koordinātām divdimensiju telpā. Telpa starp atsevišķiem datu punktiem ir sadalīta ar robežām reģionos tā, lai katrs punkts būtu tuvāk slēgtajam datu punktam nekā jebkuram citam blakus esošajam datu punktam. Šīs metodes izmantošana ir ļoti atšķirīga atkarībā no studiju jomas; tomēr daudzos gadījumos ir lietderīgi šai diagrammai pievienot papildu dimensijas, izmantojot kategorizēšanu un sarežģītu apakšgrupu atlasi.

Kategoriskā mainīgā lieluma Voronoi diagramma un eiro kurss

Trases grafiks

Trasēšanas diagramma ir īpašs līniju diagrammas gadījums.

Trasēšanas diagrammās vispirms tiek uzzīmēts divu mainīgo lielumu izkliedes diagramma, un pēc tam atsevišķie datu punkti tiek savienoti ar līniju (secībā, kādā tie ir nolasīti no datu faila). Šajā ziņā trasēšanas grafiki vizualizē secīga procesa “ceļu” (kustība, parādības izmaiņas laika gaitā utt.).

Mainīgo lielumu izsekošanas grafiks Gazprom gāzes cenas un eiro kurss

Varbūtība — varbūtības grafiks

Varbūtības-varbūtības diagrammā ir attēlota sakarība starp novēroto sadalījuma funkciju (netrūkstošo vērtību proporcija≤ x) un teorētisko sadalījuma funkciju, lai novērtētu teorētiskā sadalījuma atbilstību novērotajiem datiem. Ja visi grafa punkti atrodas uz diagonālās līnijas (ar nobīdi 0 un slīpumu 1), tad varam secināt, ka teorētiskais sadalījums ir ļoti tuvu novērotajam sadalījumam. Ja datu punkti nekrīt uz diagonālās līnijas, tad šo diagrammu var izmantot, lai vizuāli pārbaudītu, vai sadalījums atbilst datiem (piemēram, ja punkti ir sakārtoti S formā attiecībā pret diagonālo līniju, tad dati var būt nepieciešams pārveidot, lai izplatīšana atbilstu vēlamajam veidam).

Ļaujiet, piemēram, mēs vēlamies vizuāli pārbaudīt, vai daudzuma sadalījums Eiro maiņas kurss normāli. Lai to izdarītu, norādiet cilnē Turklāt izplatīšanas veids - normāls, kā arī atzīmējiet izvēles rūtiņu Aprēķināt no datiem.

Parametru iestatīšana varbūtības-varbūtības grafiku konstruēšanai.

Noklikšķināsim labi.

Varbūtības grafiks - varbūtība mainīgajam eiro kursam

Secīgi/pārklāti grafiki

Visi diagrammu veidi šajā grupā tiek izmantoti, lai attēlotu vērtību secības. Šo diagrammu pārklājuma skats ir īpaši izstrādāts, lai attēlotu lielu datu kopu kategoriju, kurā secīgi mainīgie attēlo veseluma daļas (“gabalus”).

Piemēram, izveidosim pārklājuma grafiku, piemēram, Zona mainīgajiem Eiro vērtības samazināšanās varbūtība, Varbūtība, ka eiro kurss nemainīsies Un Eiro kursa kāpuma varbūtība.

Pārklājuma (zonas) diagramma mainīgajiem lielumiem, kas norāda eiro kursa svārstību iespējamību

Diapazona diagramma

Diapazona diagrammās atlasītā mainīgā (vai mainīgo) vērtību diapazoni tiek attēloti atsevišķi novērojumu grupām, kas noteiktas ar kategorizējošā (grupēšanas) mainīgā vērtībām. Katrai novērojumu grupai tiek aprēķināta centrālā tendence (piemēram, mediāna vai vidējais) un diapazona vai variāciju statistika (piemēram, kvantiles, standarta kļūdas vai standartnovirzes), un atlasītie mainīgie tiek parādīti sarakstā norādītajā stilā. Grafika veids(cilnē Ātri vai Turklāt dialoglodziņš 2 M laiduma diagrammas). Šeit var norādīt arī emisijas punktus.

Pieņemsim, ka mums ir jānoskaidro, kādās gāzes cenu vērtībās visticamāk ir dažādas nozīmes kategoriskais mainīgais.

Gāzes cenu diapazona diagramma atkarībā no kategoriskā mainīgā lieluma.

Diapazona diagramma

Par sistēmas diapazona diagrammām parāda vērtību diapazonus vai kļūdu joslas, kas saistītas ar konkrētiem datu punktiem taisnstūru vai joslu veidā. Atšķirībā no standarta diapazonu diagrammām diapazoni vai kļūdu joslas netiek aprēķinātas no datiem, bet tiek noteiktas pēc atlasīto mainīgo sākotnējām vērtībām. Katram novērojumam tiek izveidots viens kļūdu diapazons vai kolonna. Vienkāršākajā gadījumā jums jāizvēlas trīs mainīgie, no kuriem viens attēlos viduspunktus, otrs - augšējās robežas, bet trešais - apakšējās robežas.

Piemēram, izveidosim grafikus mainīgajiem Minimums, Vidēji Un Maksimums labi.

Diapazonu diagramma mainīgajiem Minimālā, Vidējā un Maksimālā likme.

Trīskāršie grafiki

Trīskāršus (vai "trīslīniju") diagrammas izmanto, lai pārbaudītu attiecības starp vairākiem mainīgajiem, ja trīs no tiem ir, piemēram, maisījuma sastāvdaļas (tas nozīmē, ka to summa paliek nemainīga visos novērojumos). Parasti šādus grafikus izmanto, ja eksperimentāls pētījums reakcijas atkarība no trīs komponentu (piemēram, trīs ķīmisko savienojumu) relatīvā satura, savukārt komponentu attiecība mainās, lai noteiktu tās optimālā vērtība(piemēram, gatavojot maisījumu). Trīsdimensiju diagrammās tiek izmantota trīsstūrveida koordinātu sistēma plaknē (trīsdimensionāli izkliedes diagrammas vai līmeņu līnijas) vai telpā (trīsdimensionāli izkliedes diagrammas vai virsmas). Veidojot trīskāršu diagrammu, katra komponenta relatīvais ieguldījums (katram novērojumam) ir ierobežots līdz to kopējai konstantajai summai (piemēram, 1). Kad veidojat grafiku, noklusējuma proporciju skala tiek mainīta tā, lai katra novērojuma summa būtu vienāda ar 1

Mūsu gadījumā ir gluži dabiski veidot trīskāršu grafiku mainīgajiem, kas norāda eiro kursa izmaiņas.

Divdimensiju trīskāršs mainīgo lielumu diagramma, kas norāda valūtas kursa izmaiņu varbūtības.

Černova sejas

Černova sejasŠis ir viens no prasmīgāk izstrādātajiem piktogrammu veidiem. Katram novērojumam atsevišķs sejas. Mainīgie lielumi tiek attēloti kā atsevišķu sejas īpašību formas un izmēri (piemēram, deguna garums, uzacu leņķis, sejas platums). Dialoglodziņā var iestatīt diagrammā parādīto mainīgo atbilstību noteiktiem sejas vaibstiem

Izmantosim mūsu piemēru, lai parādītu, kā šo opciju var izmantot ietver apakšgrupas.

Uz cilnes Turklāt nospiedīsim pogu Izvēlieties ikonas un parādītajā logā mēs norādām atlases nosacījumu: v3>34,5 (tas ir, mēs vēlamies izcelt ikonas, kas atbilst dienām, kurās eiro kurss bija lielāks par 34,5).

Logs Iestatiet apakšgrupas

Uz cilnes Turklāt logs Piktogrāfijas norādīsim mainīgos: Kategorisks Un Nomināls

Černova sejas piktogramma

Sejas platums atbilst nominālajam mainīgajam, un ausu līmenis atbilst kategoriskajam mainīgajam. Punktētais rāmis iezīmē sejas, kas veidotas no novērojumiem, kas atbilst norādītajam nosacījumam.

Chernoff faces) - daudzdimensiju datu attēlošana cilvēka sejas formā, tās atsevišķas daļas. Cilvēki viegli atpazīst sejas un bez grūtībām uztver tajās nelielas izmaiņas.

Sejas parametri

1981. gadā Bernhard Flury un Hans Riedwyl uzlaboja koncepciju un pievienoja asimetriju Černofa sejām, kas dubultoja mainīgo skaitu (līdz 36).

Černova seju pielietojums

Černova sejas atrastas plašs pielietojums analizēt situāciju dažādās jomās. Šī metode ļauj ātri novērtēt daudzfaktoru sistēmu stāvokli (10-30 dimensiju kopas), izmantojot cilvēka iedzimto spēju ātri novērtēt cilvēka sejas izmaiņas pēc daudziem parametriem: ārstēšanas metožu novērtējums, statistikas masīvs. dati, režīma novērtējums atomelektrostacijās u.c.