summaryrefslogtreecommitdiff
path: root/lib/voices/finnish/hy_fi_mv_diphone/festvox/finnish_lex.scm
diff options
context:
space:
mode:
Diffstat (limited to 'lib/voices/finnish/hy_fi_mv_diphone/festvox/finnish_lex.scm')
-rw-r--r--lib/voices/finnish/hy_fi_mv_diphone/festvox/finnish_lex.scm216
1 files changed, 216 insertions, 0 deletions
diff --git a/lib/voices/finnish/hy_fi_mv_diphone/festvox/finnish_lex.scm b/lib/voices/finnish/hy_fi_mv_diphone/festvox/finnish_lex.scm
new file mode 100644
index 0000000..2a98ae2
--- /dev/null
+++ b/lib/voices/finnish/hy_fi_mv_diphone/festvox/finnish_lex.scm
@@ -0,0 +1,216 @@
+;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
+;;; ;;
+;;; Department of General Linguistics / Suopuhe project ;;
+;;; University of Helsinki, FI ;;
+;;; Copyright (c) 2000-2003 ;;
+;;; All Rights Reserved. ;;
+;;; ;;
+;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
+;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
+;;; ;;
+;;; Finnish lexicon for function word determination ;;
+;;; ;;
+;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
+;
+; Authors: Nicholas Volk & Martti Vainio
+;
+
+
+
+; This program is distributed under Gnu Lesser General Public License (cf. the
+; file LICENSE in distribution).
+
+; This program is free software; you can redistribute it and/or modify
+; it under the terms of the GNU Lesser General Public License as published by
+; the Free Software Foundation; either version 2 of the License, or
+; (at your option) any later version.
+
+; This program is distributed in the hope that it will be useful,
+; but WITHOUT ANY WARRANTY; without even the implied warranty of
+; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
+; GNU Lesser General Public License for more details.
+
+(define (word_list_entry? word lexicon)
+ "(word_list_entry? STRING LIST)
+Checks whether the STRING is member of any of the sublists of LIST."
+ ;; (format stderr "%s in %l?\n" sana (car leksikko))
+ (cond
+ ((null lexicon)
+ nil)
+ ((member_string word (cdr (car lexicon)))
+ t)
+ (t
+ (word_list_entry? word (cdr lexicon)))))
+
+
+
+(set! doubler_words
+ '((a terve tuore )
+ (n aihe aste kone laite lause luode näyte oire puhe purje tunne vene virhe)
+ (v aja auta mene ole ota pue pure syö tule ))
+ )
+
+(set! finnish_guess_coord
+ '((coord ja tai vai)))
+
+(set! finnish_guess_cop
+ '(
+ (cop
+ olen olet on olemme olette ovat olla ole olleet ollut
+ olin olit oli olimme olitte olivat
+ olisin olisit olisi olisimme olisitte olisivat
+ lienen lienet lienee lienemme lienette lienevät liene lienneet)))
+
+(set! finnish_guess_pron
+ '(
+ (pron
+ minä sinä hän me te he se ne
+ minun sinun hänen meidän teidän heidän sen niiden niitten
+ minua sinua häntä meitä teitä heitä sitä niitä
+ minut sinut hänet meidät teidät heidät
+ minusta sinusta hänestä meistä teistä heistä siitä niistä
+ minussa sinussa hänessä meissä heissä siinä niissä
+ minuun sinuun häneen meihin teihin heihin siihen niille
+ minulla sinulla hänellä meillä teillä heillä niillä
+ minulta sinulta häneltä meiltä teiltä heiltä niiltä
+ minulle sinulle hänelle meille teille heille sille niille
+ mä mun mua mut mussa muhun mulla mulle
+ sä sun sua sut sussa susta suhun sulla sulta sulle
+ tämä tämän tätä tässä tästä tähän tällä tältä tälle tänä
+ nämä näiden näitten näitä näissä näistä näihin näillä näiltä näille näinä
+ tuo tuon tuota tuossa tuosta tuohon tuolla tuolta tuolle tuona
+ nuo noiden noitten noissa noista noihin noilla noilta noille noina
+ joka jonka jota jossa josta johon jolla jolle jolta jona
+ jotka joiden joita joissa joista joihin joilla joilta joille joina
+ mikä minkä mitä missä mistä mihin millä miltä mille miksi
+ minne tänne sinne jonne
+ kuka ketä kenen kenessä kenestä keneen kenellä keneltä kenelle
+ ken keitä ketkä keiden keitten keissä keistä keihin keillä keiltä keille
+ kumpi kumpaa kumman kummassa kummasta kumpaan kummalla kummalta kummalle kumpana
+ )))
+
+(set! finnish_guess_pos
+ '(
+ (copula
+ olen olet on olemme olette ovat olla ole olleet ollut
+ olin olit oli olimme olitte olivat
+ olisin olisit olisi olisimme olisitte olisivat
+ lienen lienet lienee lienemme lienette lienevät liene lienneet)
+
+ (coord
+ ja tai vai)
+ (neg
+ en et ei emme ette eivät)
+ (xxx
+ ali alla allaan alle alleen alta
+ and
+ edelle edelleen edellä edellään edessä edessämme edessäni edessään edestä edestään
+ ehkei
+ eli
+ ellei ellen
+ ennen
+ eteen
+ ettei etteivät etten
+ että
+ huolimatta
+ ilman
+ joko
+ jokunen
+ jollei jolleivät
+ jos
+ jäljessä jälkeen jälkeensä
+ kanssa
+ kautta kauttaan
+ kera
+ kerran
+ keskelle keskellä keskeltä kesken
+ kohti
+ koska
+ kuin
+ kun
+ luokse luokseen luona luota luotasi
+ lähelle lähellä läheltä lähettyville
+ lähtien
+ läpi
+ miksei
+ mikäli
+ mutta muttei
+ ohella ohessa
+ ohi ohitse ohitseni
+ olemaan olemassa olemasta olematta oleva olevaa olevaan olevalla olevalle olevamme olevan olevani olevansa olevassa olevasta olevia olevien oleviin oleville olevissa olevista olkoon ollaan ollakseen olleelle olleen olleensa olleeseen olleessa olleiden olleille olleisiin olleissa olleista olleita ollen ollenkaan ollessa ollessaan ollessani ollutta oltaisiin oltaisiinko oltava oltu oltua oltuaan
+ paitsi
+ pitkin
+ poikki
+ päin päälle päälleen päällä päältään
+ riippumatta
+ saati
+ sekä
+ suhteen suhteensa
+ taakse taakseen
+ takaa takana takanaan
+ vaan
+ vaikka vaikkei
+ vailla vaille
+ varrella varrelta varressa varresta varteen
+ vastapäätä
+ vasten vastoin
+ yli ylitse
+ ympäri
+ ynnä
+ älkää älköön
+ )
+ (punc
+ "." "," ":" "!" "?" "(" ")" "\"")))
+
+;;;========================================================================
+(lex.create "finnish")
+(lex.set.phoneset "finnish")
+
+;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/lex.lex" )
+;;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/festvox/lex.lex" )
+;;;(lex.set.pos.map finnish_pos_map) ; turha...
+(lex.set.lts.method 'finnish_lts)
+;;;(lex.set.lts.ruleset 'finnish) ; turha...
+
+;;;========================================================================
+;;(lex.add.entry '("." "punc" ((( # # ) 0 ))))
+;;(lex.add.entry '(":" "punc" ((( # ) 0 ))))
+;;(lex.add.entry '(";" "punc" ((( # ) 0 ))))
+;;(lex.add.entry '("," "punc" ((( # ) 0 ))))
+;;(lex.add.entry '("?" "punc" ((( # # ) 0 ))))
+;;(lex.add.entry '("!" "punc" ((( # # ) 0 ))))
+
+;;;========================================================================
+(lex.add.entry '("a" "char" ((( a: ) 2))))
+(lex.add.entry '("b" "char" ((( b e: ) 2))))
+(lex.add.entry '("c" "char" ((( s e: ) 2))))
+(lex.add.entry '("d" "char" ((( d e: ) 2))))
+(lex.add.entry '("e" "char" ((( e: ) 2))))
+(lex.add.entry '("f" "char" ((( @ f ) 2))))
+(lex.add.entry '("g" "char" ((( g e: ) 2))))
+(lex.add.entry '("h" "char" ((( h o: ) 2))))
+(lex.add.entry '("i" "char" ((( i: ) 2))))
+(lex.add.entry '("j" "char" ((( j i: ) 2))))
+(lex.add.entry '("k" "char" ((( k o: ) 2))))
+(lex.add.entry '("l" "char" ((( @ l ) 2))))
+(lex.add.entry '("m" "char" ((( @ m ) 2))))
+(lex.add.entry '("n" "char" ((( @ n ) 2))))
+(lex.add.entry '("o" "char" ((( o: ) 2))))
+(lex.add.entry '("p" "char" ((( p e: ) 2))))
+(lex.add.entry '("q" "char" ((( k u: ) 2))))
+(lex.add.entry '("r" "char" ((( @ r ) 2))))
+(lex.add.entry '("s" "char" ((( @ s ) 2))))
+(lex.add.entry '("t" "char" ((( t e: ) 2))))
+(lex.add.entry '("u" "char" ((( u: ) 2))))
+(lex.add.entry '("v" "char" ((( v e: ) 2))))
+(lex.add.entry '("w" "char" ((( k a k ) 2) (( s o i s ) 0) (( v e: ) 1))))
+(lex.add.entry '("x" "char" ((( @ k s ) 2))))
+(lex.add.entry '("y" "char" ((( y: ) 2))))
+(lex.add.entry '("z" "char" ((( b e: ) 2))))
+(lex.add.entry '("å" "char" ((( r u o t ) 2 ) (( s a ) 0 ) (( l a i ) 1 ) (( n e n) 0 )(( o: ) 2))))
+(lex.add.entry '("ä" "char" ((( @: ) 2))))
+(lex.add.entry '("ö" "char" ((( 7: ) 2))))
+
+
+;;;========================================================================
+(provide 'finnish_lex)