KÄSIPIKAKIRJOITUKSEN TIETOKONEAVUSTEINEN KÄÄNNÖS

- Jari Niittuinperä (Pikakirjoituslehti 1-2/2000)

ITALIALAISET TUTKIMUKSEN KÄRJESSÄ

Konepikakirjoituksen etuna käsipikakirjoitukseen on pidetty kääntämisen nopeutta. Pikakirjoituskone on yhdistettävissä tietokoneeseen, joka on opetettu tulkitsemaan kirjoittajan käyttämää lyhennysjärjestelmää. Tästä on käytetty lyhennettä CAT (computer aided transcript = tietokoneavusteinen käännös). Kehitys on johtanut siihen, että Interstenon kongresseissa kilpaillaan ei vain itse kirjoittamisessa, vaan myös kääntämisen nopeudessa.

Italialaiset ovat nyt ryhtyneet tutkimaan, olisiko tietokoneavusteinen käännös mahdollinen myös käsipikakirjoituksella. Unelma kääntämisen nopeudesta on ehkä vielä kaukana, mutta periaatteessa teknologia on olemassa. Onhan jo jokapäiväisessä käytössä muistikirjoja, jotka voivat tulkita kynällä tehtyjä merkkejä. Tähän verrattuna pikakirjoituksen tulkitsemiseen tarvitaan kuitenkin enemmän älyä.

Italialaiset ovat tutkimuksissaan käyttäneet paperia, paperille kirjoitetun tekstin tietokoneen ymmärtävälle kielelle tulkitsevaa nk. skanneria ja tietokonetta. Näkökulma on haastava, sillä teksti tulkitaan vasta jälkikäteen merkeistä. Simultaaninen tulkinta lienee helpompaa, koska siinä voi saada informaatiota, joita jälkikäteen on vaikea saada, kuten tietoja merkin suunnasta, vrt "l" ja "a"-kirjaimet..

Aihetta käsiteltiin toissa kesänä Interstenon Lausannen kongressissa, jossa siitä luennoivat Ferdinando Fabi, Lucianno Nieddu, Giacomo Patrizi. Kokeita on tehty italialaisella CIMA-järjestelmällä, mutta menetelmä on sovellettavissa myös muille järjestelmille. Seuraavassa yhteenveto pohjautuu kahden jälkimmäisen esitelmään.

NOPEAN KÄÄNTÄMISEN MERKITYS

Nykypäiviin saakka nopean kirjoittamisen ohella ei ole ollut nopeaa kirjoituksen kääntämistä. Nopea kääntäminen lisää tuottavuutta.

Pikakirjoituskoneiden kuljettaminen on työlästä ja kirjoittaminen vaatii molempia käsiä, ja äänentunnistus vaatii meluttoman ympäristön ja tulee sopeuttaa puhujan ääneen. Näin ollen käsipikirjoitus ollessaan myös nopeampaa kääntää on myös tehokkaampaa. Tämä on ollut italialaisten tutkimuksen pontimena.

Tuottavuuden lisääminen ei ole aina itsestään selvää. Usein parlamenttikirjoittajat ovat väitelleet, mikä on todellinen hyöty, kun suuri osa ajasta menee tekstin stilisointiin. Joka tapauksessa on tilanteita, jossa nopeasta kääntämisestä on hyötyä. Esimerkiksi BBC tekstityttää runsaasti suoria tv-lähetyksiä pikakirjoittajilla.

PIKAKIRJOITTEEN MUUNTAMINEN KONEEN YMMÄRTÄMÄÄN MUOTOON

Ennen kuin kone voi analysoida pikakirjoitetta, se on käännettävä koneen ymmärtämään muotoon. Tämä voi tapahtua esimerkiksi seuraavasti:

1. Alueen, jolla pikakirjoite on, määrittäminen
2. Pikakirjoitteen siirtäminen koneen ymmärtämään muotoon. Tämä voi tapahtua esimerkiksi skannerilla.
3. Kunkin pikakirjoitusmerkki muuntaminen sarjaksi pikakirjoitekirjaimia
4. Yksittäisten kirjainten tulkitseminen
5. Sanan tai lauseen muodostaminen
6. Lyhenteiden tulkitseminen ja kielioppisääntöjen huomioon ottaminen

SKANNATTAVAN ALUEEN SIJOITTELU

Pikakirjoitusmerkkien tulkitsemisessa on tärkeä tunnistaa alue, jossa pikakirjoite on. Tulkitsevalle ohjelmalle välitettävä alue on suorakulmainen neliö, esimerkiksi A4-paperi.

Paperin, jolle kirjoitetaan tulee olla hyvää, ja siinä voi olla perusviiva tai -viivoja. Jos käytetään perusviivoja, kone voinee helpommin tunnistaa perusrivit ja merkkien astevaihtelut.

Skanneri jakaa skannattavan alueen pieniin pisteisiin, pikseleihin. Skanneri tunnistaa kunkin pisteen ja sen, onko kyseisessä pisteessä kirjoitusta vai ei. Nämä pisteet välitetään taulukkomuodossa pikakirjoitusmerkit tulkitsevalle ohjelmalle.

Kun paperi asetetaan skannerille, sitä ei käytännössä juuri voida asettaa siten, että kirjoitus olisi aivan vaakatasossa. Kun paperi on skannattu, ohjelmiston tulee pystyä kääntämään kirjoitus vaakatasoon tätä varten kehitetyllä laskenta-algoritmilla.

KUVAN SEGMENTOINTI PIKAKIRJOITUSMERKKIRIVIKSI

Kun pikakirjoite on skannattu koneelle, tulee koneen tunnistaa yksittäiset pikakirjoitusmerkkirivit. Rivin paikkahan voi todellisuudessa vaihdella, vaikka käytettäisiin valmiiksi viivoitettua paperia, koska tulostusvaiheessa rivit voivat olla aavistuksen eri paikoissa. Kirjoitettaessa valkoiselle paperille koneen täytyy tunnistaa kirjoituksesta kantaviiva.

Ensin ohjelma analysoi vaakatasossa, kuinka paljon kullekin vaakatason pikseli-riville on kirjoitettu. Näistä saadaan horisontaalinen histogrammi, jossa selvästi on havaittavissa jaksotus. Pikakirjoitusmerkkirivi voidaan löytää, koska rivien välissä on selvästi alue, jolle ei ole lainkaan kirjoitettu tai on kirjoitettu vain vähän (ks. Kuva 1).

YKSITTÄISTEN MERKKIEN TUNNISTAMINEN

Kun pikakirjoitusmerkkirivit on tunnistettu, tulee pystyä tunnistamaan yksittäiset pikakirjoitusmerkit.

Rinnakkaiset merkit on tunnistettavissa vastaavalla tavalla kuin rivitkin analysoimalla horisontaalin histogrammin sijasta vertikaalista histogrammia.

Kukin pikakirjoitusmerkki taas koostuu yksittäisistä kirjainmerkeistä. Ongelma on yksittäisten kirjainmerkkien erottaminen toisistaan. Tähän palataan myöhemmin.

Ensimmäinen ongelma on kirjainmerkkien erottaminen toisistaan. Tätä varten kukin kirjainmerkki, esimerkiksi "st" analysoidaan sekä vaaka- että pystyhistogrammeilla. Tämä tieto talletetaan muistiin, jotta merkki voidaan tunnistaa. Koska merkkejä ei joka kerta kirjoiteta täsmälleen samalla tavalla, näyte kirjotetaan useaan kertaan. Kantaan talletetaan yksittäisen näytteen sijasta eri näytteiden keskiarvo.

Tutkimuksen tekijät toteavat olevan periaatteessa jopa mahdollista, että näyte otetaan usealta henkilöltä ja jokaisen kirjoitustyyli analysoidaan. Tällöin saadaan yleinen, kaikkien kirjoitukselle soveltuva analyysi. Lienee syytä epäillä, että kirjoitustyylit poikkeavat toisistaan niin paljon, että yleisen analyysin luominen ei ole mahdollista.

Histogrammeista lasketaan tilastollisia tunnuslukuja, kuten keskiarvo ja eri momentteja. Tulkittaessa merkkejä valitaan se merkki, joka on etäisyydeltään lähinnä analysoitua merkkiä.

Vertailuaineiston tekemisessä hitainta on pikakirjoitusmerkkien vieminen järjestelmään. Itse laskenta on nopeaa, sillä merkkien vertailuun käytettävä algoritmi on varsin nopea.

CIMA-järjestelmää varten tutkijat joutuivat analysoimaan 27 merkkiä:
a, b, c, d, e, f g, i, l, m, n, o, p, q, r, s t, u, v z, sc(i), gli, gn, gu, in(a), in(d), con

Tutkijat järjestivät kokeen, jossa viisi kirjoittajaa kirjoitti sekä näytteet että antoi vertailuaineiston.

Tutkimukset osoittivat, että sovellus pystyi tunnistamaan 89 % merkeistä, jos malleja oli 2200 ja 91 % merkeistä, jos malleja oli 3200. Edellisessä tapauksessa kone käytti 725 ja jälkimmäisessä 811 mallia. Tämä tarkoittaa, että kone tunnisti osan eri kirjoittajien merkeistä samoiksi.

Tutkijat toistivat kokeita ja totesivat keskimääräisen tarkkuuden olevan 88,6 %.

Koska menetelmässä tulkitaan paperille tehtyjä merkkejä, ongelmaksi havaittiin se, että ohjelma tulkitsi tai yritti tulkita kaikki paperilla olevat epäpuhtaudetkin, kuten ylimääräiset viivat marginaalissa. Tämä on kyllä teknisesti hallittavissa.

Jos verrataan tuloksia äänentunnistuksen alkuaikojen tuloksiin, tulokset eivät olleet näinkään hyviä. Oletettavaa on, että tässäkin tunnistuksessa edetään, varsinkin kun tunnistamiseen voidaan liittää oikeinkirjoitusohjelmia.

Kuten alussa totesin, kirjoitusalusta voitaisiin myös valita sellaiseksi, että kone voisi simultaanisesti tulkita tekstiä. Tällöin se voisi saada lisäinformaatiota kirjoituksesta ja tarkkuus paranisi.

PIKAKIRJOITUSMERKIN JAKAMINEN KIRJAIMIKSI

Pikakirjoitusmerkkien tunnistamisen jälkeen merkit tulee voida jakaa jälleen kirjaimiksi.

Periaatteessa tapoja on neljä:
1. Pikakirjoitusmerkin tunnistaminen suoraan tietyksi sanaksi
2. Pikakirjoitusmerkin yksittäisten kirjaimien tunnistaminen
3. Pikakirjoitusmerkin tunnistaminen segmenteiksi, joissa on sarja yksittäisiä kirjaimia ja merkkejä
5. Pikakirjoitusmerkkien tunnistaminen segmenteiksi vertaamalla segmenttejä mallipohjiin

Simultaanitulkinnassa eräät kirjoitustavat ovat tehokkaampia kuin toiset.

PIKAKIRJOITUSMERKIN TUNNISTAMINEN SUORAAN SANAKSI

Pikakirjoitusmerkin tulkitseminen suoraan tietyksi sanaksi on periaatteessa samanlaista kuin yksittäisten merkkien tulkitseminen, kuten artikkelin ensimmäisessä osassa kerrottiin.

Italialaiset tutkijat laskevat, että tämä edellyttäisi noin 150.000 sanan tietokantaa. He eivät kuitenkaan ole ottaneet huomioon, että esimerkiksi suomenkielessä tämä tarkoittaisi kannan moninkertaistumista, koska sijamuodoltaan eroavat sanat pitäisi tulkita eri sanoiksi. Näin on kuitenkin myös äänentunnistuksessa, mutta tehokkailla hakumenetelmillä haku kannasta voisi silti olla varsin nopeaa.

Suurimmaksi ongelmaksi muodostuisi hakutietokannan teko. Se olisi erittäin suuri työ, jollei hakutietokannan tekoa voi jotenkin automatisoida.

PIKAKIRJOITUSMERKIN YKSITTÄISTEN KIRJAIMIEN TUNNISTAMINEN

Yllämainittua suurta tietokantaa voidaan pienentää analysoimalla yksittäisten merkkien sijasta kirjaimia, joista merkki muodostuu.

Tässä menetelmässä on tärkeä tunnistaa, mistä kukin kirjain alkaa. Tämän tiedon lisäksi kuhunkin kirjaimeen liitetään tieto siitä, mihin suuntaan kirjain lähtee (esim. koilliseen). Näistä voidaan päätellä mm. kirjainten järjestys, eli onko R ennen E:tä vai päinvastoin.

Aika, joka tarvitaan kirjainten erottamiseen toisistaan, riippuu kirjainten määrästä. Toistaiseksi kirjainten erottaminen on hidasta. Jos merkki koostuu 10 kirjaimesta, kirjainten erottamiseen tarvittiin testeissä vajaasta minuutista kuuteen minuuttiin, eli vielä menetelmä on liian hidas.

PIKAKIRJOITUSMERKIN TUNNISTAMINEN SEGMENTTEINÄ

Jos edellä mainittua kirjainten määrää olisi voitu vähentää viiteen, mikä toki useimmiten olisi lyhennystekniikan takia riittävä kokouspikakirjoittajalle, kirjainten erotteluun menisi enää noin 0.3 sekunttia.

Italialaiset arvioivat, että tällä tekniikalla voitaisiin tulkita aina 200 merkkiä minuutissa, eli käytännössä käännös voisi olla tosiaikaista.

Tämän takia voisi olla järkevää tulkita yksittäisten kirjainten sijasta kirjainyhdistelmiä.

Kun analysoidaan yksittäisten kirjainten sijasta kirjainyhdistelmiä, on tärkeää tietää, mitkä ovat merkin osien suhteet toisiinsa. Tutkimusten mukaan nämä vaihtelevat henkilöittäin, joten kone tulisi opettaa henkilön käsialaan.

SEGMENTTIEN TUNNISTAMINEN MALLIPOHJIEN AVULLA

Kun kirjainyhdistelmien määrä kasvaa, voidaan puhua kirjoitussegmentistä. Tämä voi olla yksittäinen merkki tai pidempi kirjainyhdistelmä.

Tämä on tavallaan edellisten menetelmien laajennus. Erityistä huomiota tulee tällöin kiinnittää algoritmiin, jolla segmentit tunnistetaan.

SANAN JA LAUSEEN MUODOSTAMINEN

Nykyisissä tekstinkäsittelyohjelmistoissa on tehokkaat oikeinkirjoitus- ja jopa kielioppiohjelmat. Näitä käyttäen voidaan lopulliset kirjoitusasut vielä korjata. Eräät ohjelmistot pystyvät kohtalaisesti päättelemään myös isot kirjaimet.

Suomen kielen pikakirjoituksessa yleiset päätteen kirjoittamatta jättämiset olisi korjattava esimerkiksi kielioppiohjelmalla.

Oikeinkirjoitus- ja kielioppiohjelmat voidaan käynnistää automaattisesti esimerkiksi tekstinkäsittelyohjelmistojen nk. makroilla tai skripteillä.

YLEISIÄ HUOMIOITA

Käytännössä varmaan olisi järkevää yhdistää edellä mainittuja neljää menetelmää. Sitä, minkä menetelmän ohjelma valitsee, ei ole vielä ratkaistu.

Ennen ohjelmiston käyttöönottoa kone tulisi räätälöidä kirjoittajan käsialalle, kuten konepikakirjoituksessakin tehdään.

Tutkijat eivät ole miettineet sitä, miten lyhennejärjestelmä opetetaan käsipikakirjoitusta tulkitsevalle ohjelmistolle. Tähän varmaan vihjeitä on saatavissa konepikakirjoitusjärjestelmistä, joissa myös on omat lyhennejärjestelmänsä.

JOHTOPÄÄTÖKSET

Italialaiset ovat tutkineet erityisesti oman pikakirjoitusjärjestelmänsä, CIMA:n soveltuvuutta käsipikakirjoituksen tietokoneavusteiseen käännökseen. Tutkimusta tulisi laajentaa myös muihin pikakirjoitusjärjestelmiin.
 

Joka tapauksessa tutkimus on mielenkiintoinen ja selvästi tehty vakavassa hengessä. Tavoite on haastava. Monet nykyään itsestään selvät asiat ovat aikoinaan tuntuneet jopa mahdottomilta toteuttaa. Onneksi on löytynyt ennakkoluulottomia tutkijoita ja tiedemiehiä, jotka ovat tehneet mahdottomasta mahdollisia. Toivon tällekin hankkeelle mitä parhainta menestystä.

Tutkimuksen tekijät näkevät, että tietokoneavusteinen tulkinta nostaisi käsipikakirjoituksen uuteen nousuun. Olisihan kirjoittaminen mahdollista missä tahansa, kunhan mukana on kynää ja paperia. Monien tuskailema jälkityö jätettäisiin tietokoneille.

Toivotan sydämestäni onnea hankkeelle.