;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; ;;; ;; ;;; Department of General Linguistics / Suopuhe project ;; ;;; University of Helsinki, FI ;; ;;; Copyright (c) 2000-2003 ;; ;;; All Rights Reserved. ;; ;;; ;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; ;;; ;; ;;; Finnish lexicon for function word determination ;; ;;; ;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; ; ; Authors: Nicholas Volk & Martti Vainio ; ; This program is distributed under Gnu Lesser General Public License (cf. the ; file LICENSE in distribution). ; This program is free software; you can redistribute it and/or modify ; it under the terms of the GNU Lesser General Public License as published by ; the Free Software Foundation; either version 2 of the License, or ; (at your option) any later version. ; This program is distributed in the hope that it will be useful, ; but WITHOUT ANY WARRANTY; without even the implied warranty of ; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the ; GNU Lesser General Public License for more details. (define (word_list_entry? word lexicon) "(word_list_entry? STRING LIST) Checks whether the STRING is member of any of the sublists of LIST." ;; (format stderr "%s in %l?\n" sana (car leksikko)) (cond ((null lexicon) nil) ((member_string word (cdr (car lexicon))) t) (t (word_list_entry? word (cdr lexicon))))) (set! doubler_words '((a terve tuore ) (n aihe aste kone laite lause luode näyte oire puhe purje tunne vene virhe) (v aja auta mene ole ota pue pure syö tule )) ) (set! finnish_guess_coord '((coord ja tai vai))) (set! finnish_guess_cop '( (cop olen olet on olemme olette ovat olla ole olleet ollut olin olit oli olimme olitte olivat olisin olisit olisi olisimme olisitte olisivat lienen lienet lienee lienemme lienette lienevät liene lienneet))) (set! finnish_guess_pron '( (pron minä sinä hän me te he se ne minun sinun hänen meidän teidän heidän sen niiden niitten minua sinua häntä meitä teitä heitä sitä niitä minut sinut hänet meidät teidät heidät minusta sinusta hänestä meistä teistä heistä siitä niistä minussa sinussa hänessä meissä heissä siinä niissä minuun sinuun häneen meihin teihin heihin siihen niille minulla sinulla hänellä meillä teillä heillä niillä minulta sinulta häneltä meiltä teiltä heiltä niiltä minulle sinulle hänelle meille teille heille sille niille mä mun mua mut mussa muhun mulla mulle sä sun sua sut sussa susta suhun sulla sulta sulle tämä tämän tätä tässä tästä tähän tällä tältä tälle tänä nämä näiden näitten näitä näissä näistä näihin näillä näiltä näille näinä tuo tuon tuota tuossa tuosta tuohon tuolla tuolta tuolle tuona nuo noiden noitten noissa noista noihin noilla noilta noille noina joka jonka jota jossa josta johon jolla jolle jolta jona jotka joiden joita joissa joista joihin joilla joilta joille joina mikä minkä mitä missä mistä mihin millä miltä mille miksi minne tänne sinne jonne kuka ketä kenen kenessä kenestä keneen kenellä keneltä kenelle ken keitä ketkä keiden keitten keissä keistä keihin keillä keiltä keille kumpi kumpaa kumman kummassa kummasta kumpaan kummalla kummalta kummalle kumpana ))) (set! finnish_guess_pos '( (copula olen olet on olemme olette ovat olla ole olleet ollut olin olit oli olimme olitte olivat olisin olisit olisi olisimme olisitte olisivat lienen lienet lienee lienemme lienette lienevät liene lienneet) (coord ja tai vai) (neg en et ei emme ette eivät) (xxx ali alla allaan alle alleen alta and edelle edelleen edellä edellään edessä edessämme edessäni edessään edestä edestään ehkei eli ellei ellen ennen eteen ettei etteivät etten että huolimatta ilman joko jokunen jollei jolleivät jos jäljessä jälkeen jälkeensä kanssa kautta kauttaan kera kerran keskelle keskellä keskeltä kesken kohti koska kuin kun luokse luokseen luona luota luotasi lähelle lähellä läheltä lähettyville lähtien läpi miksei mikäli mutta muttei ohella ohessa ohi ohitse ohitseni olemaan olemassa olemasta olematta oleva olevaa olevaan olevalla olevalle olevamme olevan olevani olevansa olevassa olevasta olevia olevien oleviin oleville olevissa olevista olkoon ollaan ollakseen olleelle olleen olleensa olleeseen olleessa olleiden olleille olleisiin olleissa olleista olleita ollen ollenkaan ollessa ollessaan ollessani ollutta oltaisiin oltaisiinko oltava oltu oltua oltuaan paitsi pitkin poikki päin päälle päälleen päällä päältään riippumatta saati sekä suhteen suhteensa taakse taakseen takaa takana takanaan vaan vaikka vaikkei vailla vaille varrella varrelta varressa varresta varteen vastapäätä vasten vastoin yli ylitse ympäri ynnä älkää älköön ) (punc "." "," ":" "!" "?" "(" ")" "\""))) ;;;======================================================================== (lex.create "finnish") (lex.set.phoneset "finnish") ;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/lex.lex" ) ;;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/festvox/lex.lex" ) ;;;(lex.set.pos.map finnish_pos_map) ; turha... (lex.set.lts.method 'finnish_lts) ;;;(lex.set.lts.ruleset 'finnish) ; turha... ;;;======================================================================== ;;(lex.add.entry '("." "punc" ((( # # ) 0 )))) ;;(lex.add.entry '(":" "punc" ((( # ) 0 )))) ;;(lex.add.entry '(";" "punc" ((( # ) 0 )))) ;;(lex.add.entry '("," "punc" ((( # ) 0 )))) ;;(lex.add.entry '("?" "punc" ((( # # ) 0 )))) ;;(lex.add.entry '("!" "punc" ((( # # ) 0 )))) ;;;======================================================================== (lex.add.entry '("a" "char" ((( a: ) 2)))) (lex.add.entry '("b" "char" ((( b e: ) 2)))) (lex.add.entry '("c" "char" ((( s e: ) 2)))) (lex.add.entry '("d" "char" ((( d e: ) 2)))) (lex.add.entry '("e" "char" ((( e: ) 2)))) (lex.add.entry '("f" "char" ((( @ f ) 2)))) (lex.add.entry '("g" "char" ((( g e: ) 2)))) (lex.add.entry '("h" "char" ((( h o: ) 2)))) (lex.add.entry '("i" "char" ((( i: ) 2)))) (lex.add.entry '("j" "char" ((( j i: ) 2)))) (lex.add.entry '("k" "char" ((( k o: ) 2)))) (lex.add.entry '("l" "char" ((( @ l ) 2)))) (lex.add.entry '("m" "char" ((( @ m ) 2)))) (lex.add.entry '("n" "char" ((( @ n ) 2)))) (lex.add.entry '("o" "char" ((( o: ) 2)))) (lex.add.entry '("p" "char" ((( p e: ) 2)))) (lex.add.entry '("q" "char" ((( k u: ) 2)))) (lex.add.entry '("r" "char" ((( @ r ) 2)))) (lex.add.entry '("s" "char" ((( @ s ) 2)))) (lex.add.entry '("t" "char" ((( t e: ) 2)))) (lex.add.entry '("u" "char" ((( u: ) 2)))) (lex.add.entry '("v" "char" ((( v e: ) 2)))) (lex.add.entry '("w" "char" ((( k a k ) 2) (( s o i s ) 0) (( v e: ) 1)))) (lex.add.entry '("x" "char" ((( @ k s ) 2)))) (lex.add.entry '("y" "char" ((( y: ) 2)))) (lex.add.entry '("z" "char" ((( b e: ) 2)))) (lex.add.entry '("å" "char" ((( r u o t ) 2 ) (( s a ) 0 ) (( l a i ) 1 ) (( n e n) 0 )(( o: ) 2)))) (lex.add.entry '("ä" "char" ((( @: ) 2)))) (lex.add.entry '("ö" "char" ((( 7: ) 2)))) ;;;======================================================================== (provide 'finnish_lex)