Eletään informaatioaikakautta, on olemassa dataa – tietoa – numeraalisessa ja ei-numeraalisessa muodossa, josta pitäisi päätellä jotain. Katsot mihin tahansa, ympärilläsi on vuorittain – gigatavuja – dataa. Mark Twain sanoi aikoinaan, että vale, emävale ja tilasto. Valehteleeko tilasto vai tulkitseeko numeronaivi tilastosta kohinan singaaliksi? Kuinka välttyä informaation käyttössä tältä harhalta? Tämä kysymys on tärkeä kaikissa datan käyttötarkoituksissa.
Varmista datan oikeellisuus
Organisaatioissa ja yrityksissä on kerätty, kerätään ja parasta aikaa mietitään, kuinka kerättäisi tietoa ja dataa toiminnasta ja/ tai prosessista.
Datan täytyy olla oikeaa dataa,
- dataa täytyy pystyä analysoimaan ja esittämään ymmärrettävällä tavalla, ja
- tuloksia saa tulkita vain siinä ”ympäristössä, kontekstissa”, josta alkuperäinen data on otettu/vedetty.
Analysoi ja osaa analysoida – vain signaalista voi oppia!
Edistys ja kehitys perustuvat viimekädessä vertailuun, kahdesta tai useammasta hyvästä on valittava parempi! Asiakas vertailee ja valmistaja vertailee! Mikä tuote on parempi? Mikä konstruktio on parempi? Mikä materiaali on parempi? Mikä tuotantomenetelmä on parempi? Mikä tuotantokone on parempi? Mitkä asetukset ovat paremmat? Vertailua, Vertailua!
Toiminnan ja laadun parantamisessa ja haetaan vaihtoehtoja ja tehdään vertailua valitaksemme parempia vaihtoehtoja ja varmennamme, että olemme onnistuneet vertailussa?
Tuotekehityksessä ja tuotannossa käytetään yleisesti hyvin kallista ja tehotonta yksimuuttujavertailua DoE:n sijaa. Mitä vertailutaktiikkaa sinä käytät? Hallitsetko monimuuttujatekniikat – DOE?
Taulukossa 1 on kuvattu suunnitellun kokeen tuoma hyöty. Käytännössä tämä tarkoittaa dramaattista kehitysnopeuden kasvua. Vasemmassa laidassa tutkittavien tekijöiden määrä, keskellä perinteisesti tehtävien kokeiden määrä ja oikealla DOE tekniikalla tehtävien kokeiden määrä.
Vertailujen tuloksena syntyy dataa – tilastoja. Nämä tilastot ovat käytännössä tuotantoraportteja, vuosiraportteja, tutkimustuloksia, prosessidataa, käyttäytymisdata, mitä tahansa tietoa. Maailma käyttäytyy nykytieteen tuntemuksen mukaisesti niin, että vain harva data pitää sisällään informaatiota – signaalia. Signaalia on vain harvassa datassa (n. 2 %), mutta kohinaa sisältää kaikki data (n. 98 %). Kuvassa 2 punaiset pisteet ovat signaaleja ja mustat pisteet edustavat kohinaa. Seuraus tästä realiteetista on, että milloinkaan voida tehdä järkeviä päätöksiä, ennen kuin suodatetaan pois KOHINA. Ensisijainen työkalu tässä suodatuksessa on yksinkertainen SPC-kortti, joka tunnetaan nimellä I-mR eli Individual-kortti.
Jos emme suodata kohinaa pois voimme, voimme tulkita rutiinivaihtelun eli kohinan signaalina! Tämä on tyypillinen tilanne aamu- viikko- kk-palavereissa sekä neljännes- ja vuosikatsauksissa, joissa tutkitaan ja verrataan kuinka on mennyt. Liki 98 % organisaatiossa tulkitaan tätä kohinaa! Huomatkaa, jos tulos poikkeaa halutusta – kuten budjetti tai tavoite – se ei tarkoita välttämättä, että ko. tapaukselle voitaisiin löytää selvittävä tekijä. Jos teemme näin, päädymme lopulta kuvaamaan tapahtunutta muutosta olemattomilla syillä, joka vääjäämättä johtaa siihen, että selityksemme ei ole sen todellisuuden mukainen, jossa työskentelemme.
Toisaalta jos ajatellaan, että vaihtelu on vain rutiinia eikä erottele rutiinivaihtelua poikkeuksellisesta vaihtelusta, päädytään lopulta hukkaamaan signaalin. Tämä johtaa, että ei ymmärretä ongelmaa ja menetetään mahdollisuus oppia. Tässä tapauksessa kehitys hidastuu ja jäädään jälkeen, jos kilpailijat hallitsevat tämän. Tämä on tyypillistä edellä esitetyissä foorumeissa, kun ollaan lähellä tavoitetta, ei huomata mahdollista muutosta.
Tulosten vertailun analyysissä voidaan tehdä kaksi erhettä, kun tulkitaan dataa:
- Tulkitaan kohina signaaliksi ja ajaudutaan selitykseen, jota ei ole
- Tulkitaan signaali kohinaksi ja epäonnistutaan oppimisessa, mitä pitäisi oppia
Seuraus näistä kahdesta erheestä, jossa sekoitetaan signaali kohinaan ja kohina signaaliin, on perustavaa laatua, aina ja kaikissa muodoissa data-analyysiä. Analyysi vaatii tämän erottelun ja jokainen yritys tulkita dataa ilman analyysiä on osoitus numeerisesta NAIVIUDESTA.
Valitettavasti on olemassa valtavasti NUMERONAIVEJA. Ongelma on, että nämä ihmiset eivät tunnista tätä piirrettä itsestään. He ajattelevat, että koska he osaavat laskea, he ovat päteviä tulkitsemaan dataa. Heidän ajattelunsa voi summata ”Kaksi numeroa, jotka eivät ole sama, ovat eri!” Tämä osaamattomuus johdon ja kehitysihmisten yhteydessä johtaa merkittäviin epäonnistumisiin. Usein ylistetään heitä onnistumisista ja markkinoiden analysoinnista, mutta voisiko olla kysymys markkinoista, valtionvarainministeriön onnistumisesta eli kysynnästä vai todella osaamisesta?
Tämä tiedostamaton naiviuden teoria kääntää kaiken signaaliksi, kaksi pistettä muodostaa aina trendin, ja selityksiä vaaditaan kaikista (ei-toivottavista) kohinoista tuotanto-, laatu-, viikko- tai kuukausiraporteissa.
Ensimmäinen askel välttää numeerinen naivititeetti on ymmärtää data analyysin kahden erheen luonne.
Erhe I: Tulkitsemalla kohinan aikaansaama rutiini vaihtelu niin kuin se olisi prosessin muutossignaalin aikaansaama, vaikka se tosiasiassa on virhe signaali.
Erhe II: Ajattelemalla, että tutkittavan prosessin muutossignaali on vain pelkkää rutiinivaihtelun kohinaa, menetetään signaali.
Alla olevassa taulukossa 2 on esitetty päätöksentekomatriisi ja erheet 1 ja 2.
- Voit olla tekemättä erheen I kieltämällä kaiken, joka on signaali ja toisaalta – jäät kotiin, että ei satu mitään, mutta kuolet kuitenkin
- Voit olla tekemättä erhettä II yksinkertaisesti tulkitsemalla kaiken signaaliksi – ostat, myyt, teet kaikkea mitä mieleen tulee ja onnistut sekä pyrit unohtamaan epäonnistumiset
”Temppu” on balansoida kahden erheen välillä suodattamalla rutiinivaihtelun kohinaa pois niin, että voimme havaita potentiaalisen signaalin datastamme. Tämä on oleellista kaikille tehokkaille data-analyyseille.
Luotettavuusvälit, hypoteesitestit, regressiotekniikat ja tietysti DoE on suunniteltu ”puristamaan” viimeinenkin pisara kiinteästä ja äärellisestä määrästä koedataa (DoE). Todennäköisyysmallit ja kriittiset arvot on tarkoitettu ”terävöittämään” analyysejä niin, että kohtuullisen suurta signaalia ei hukata.
Toisaalta vastakohtana koedata-analyyseille (toiminnan tuloksena syntynyt data) on prosessin käyttäytymistä kuvaavat käyrät (SPC-kortit), jotka erottelevat potentiaalisen signaalin todennäköisestä kohinasta käyttämällä geneeristä (kaiken kattavaa) ja kiinteää kolme-sigma rajaa analyysipohjana. SPC-kortit ja niihin liittyvät menettelyt ja tekniikat ovat ainoat jatkuvan operaation/tuotantodatan analyysimenetelmät. Kaiken lisäksi SPC sallii suorittaa tämän erottelun käyttämällä dataa, joka on saatu olemassa olevasta prosessin tilasta ilman että tarvitsee tehdä mitään erityisiä kokeita tai tutkimuksia.
Seuraavassa artikkelissa jatketaan aihetta ja käsitellään tarkemmin tiedon keräämistä, analysointia, tulkintaa ja omaksuntaa. Jos analysoit oikein, tulkitset oikein, mutta jostain syytä et pääse haluttuun tulokseen, missä vika?
Lue tästä muut artikkelisarjan osat:
I. osa: käsittelee datan laatua ja laatuteknologian rooli datan laadun parantamisessa, 27.1.2009
II. osa: käsittelee datan analyysiä; signaali vs. kohina, 13.2.2009
III. osa: käsittelee datan keräystä ja signaalityyppejä, 11.3.2009
Osa IV: 14.4.2009
Tilaa uutiskirje
Liity postituslistalle ja saat uusimmat artikkelit suoraan sähköpostiisi.
Tämä lomake on suojattu Google reCAPTCHA:lla. Lue tietosuojaseloste ja käyttöehdot.
Liittymällä postituslistalle hyväksyt Quality Knowhow Karjalainen Oy:n tietosuojaselosteen ja Quality Knowhow Karjalainen Oy voi lähettää sinulle ajankohtaisia artikkeleita, videoita sekä tietoa ja tarjouksia kursseista, kirjoista sekä ohjelmistoista.