summaryrefslogtreecommitdiff
path: root/lib/voices/finnish/hy_fi_mv_diphone/festvox/finnish_lex.scm
blob: 2a98ae2831154fdf81a9dd88729b4ad22a8d3b05 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;;                                                                       ;;
;;;          Department of General Linguistics / Suopuhe project          ;;
;;;                      University of Helsinki, FI                       ;;
;;;                       Copyright (c) 2000-2003                         ;;
;;;                        All Rights Reserved.                           ;;
;;;                                                                       ;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;;                                                                       ;;
;;; Finnish lexicon for function word determination                       ;;
;;;                                                                       ;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;
; Authors: Nicholas Volk & Martti Vainio
;



; This program is distributed under Gnu Lesser General Public License (cf. the
; file LICENSE in distribution).
 
; This program is free software; you can redistribute it and/or modify
; it under the terms of the GNU Lesser General Public License as published by
; the Free Software Foundation; either version 2 of the License, or
; (at your option) any later version.
 
; This program is distributed in the hope that it will be useful,
; but WITHOUT ANY WARRANTY; without even the implied warranty of
; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
; GNU Lesser General Public License for more details.

(define (word_list_entry? word lexicon)
  "(word_list_entry? STRING LIST)
Checks whether the STRING is member of any of the sublists of LIST."
  ;; (format stderr "%s in %l?\n" sana (car leksikko))
  (cond
   ((null lexicon)
    nil)
   ((member_string word (cdr (car lexicon)))
    t)
   (t
    (word_list_entry? word (cdr lexicon)))))



(set! doubler_words
  '((a terve tuore )
    (n aihe aste kone laite lause luode nyte oire puhe purje tunne vene virhe)
    (v aja auta mene ole ota pue pure sy tule ))
  )

(set! finnish_guess_coord
      '((coord ja tai vai)))

(set! finnish_guess_cop
  '(
    (cop
     olen olet on olemme olette ovat olla ole olleet ollut
     olin olit oli olimme olitte olivat 
     olisin olisit olisi olisimme olisitte olisivat
     lienen lienet lienee lienemme lienette lienevt liene lienneet)))

(set! finnish_guess_pron
      '(
    (pron 
     min sin hn me te he se ne
     minun sinun hnen meidn teidn heidn sen niiden niitten 
     minua sinua hnt meit teit heit sit niit
     minut sinut hnet meidt teidt heidt
     minusta sinusta hnest meist teist heist siit niist
     minussa sinussa hness meiss        heiss siin niiss
     minuun sinuun hneen meihin teihin heihin siihen niille
     minulla sinulla hnell meill teill heill       niill
     minulta sinulta hnelt meilt teilt heilt       niilt
     minulle sinulle hnelle meille teille heille sille niille
     m mun mua mut mussa       muhun mulla       mulle
     s sun sua sut sussa susta suhun sulla sulta sulle
     tm tmn tt tss tst thn tll tlt tlle tn
     nm niden nitten nit niss nist nihin nill nilt nille nin
     tuo tuon tuota tuossa tuosta tuohon tuolla tuolta tuolle tuona
     nuo noiden noitten noissa noista noihin noilla noilta noille noina
     joka jonka jota jossa josta johon jolla jolle jolta jona
     jotka joiden joita joissa joista joihin joilla joilta joille joina
     mik mink mit miss mist mihin mill milt mille miksi
     minne tnne sinne jonne
     kuka ket kenen keness kenest keneen kenell kenelt kenelle 
     ken keit ketk keiden keitten keiss keist keihin keill keilt keille 
     kumpi kumpaa kumman kummassa kummasta kumpaan kummalla kummalta kummalle kumpana
     )))
    
(set! finnish_guess_pos
  '(
    (copula 
     olen olet on olemme olette ovat olla ole olleet ollut
     olin olit oli olimme olitte olivat 
     olisin olisit olisi olisimme olisitte olisivat
     lienen lienet lienee lienemme lienette lienevt liene lienneet)
    
    (coord 
     ja tai vai)
    (neg  
     en et ei emme ette eivt)
    (xxx 
     ali alla allaan alle alleen alta
     and
     edelle edelleen edell edell��n edess edessmme edessni edess��n edest edest��n
     ehkei
     eli
     ellei ellen
     ennen
     eteen
     ettei etteivt etten
     ett
     huolimatta
     ilman
     joko
     jokunen
     jollei jolleivt
     jos
     jljess jlkeen jlkeens
     kanssa
     kautta kauttaan
     kera
     kerran
     keskelle keskell keskelt kesken
     kohti
     koska
     kuin
     kun
     luokse luokseen luona luota luotasi
     lhelle lhell lhelt lhettyville
     lhtien
     lpi
     miksei
     mikli
     mutta muttei
     ohella ohessa
     ohi ohitse ohitseni
     olemaan olemassa olemasta olematta oleva olevaa olevaan olevalla olevalle olevamme olevan olevani olevansa olevassa olevasta olevia olevien oleviin oleville olevissa olevista olkoon ollaan ollakseen olleelle olleen olleensa olleeseen olleessa olleiden olleille olleisiin olleissa olleista olleita ollen ollenkaan ollessa ollessaan ollessani ollutta oltaisiin oltaisiinko oltava oltu oltua oltuaan
     paitsi
     pitkin
     poikki
     pin p��lle p��lleen p��ll p��lt��n
     riippumatta
     saati
     sek
     suhteen suhteensa
     taakse taakseen
     takaa takana takanaan
     vaan
     vaikka vaikkei
     vailla vaille
     varrella varrelta varressa varresta varteen
     vastap��t
     vasten vastoin
     yli ylitse
     ympri
     ynn
     lk�� lk��n
     )    
    (punc 
     "." "," ":" "!" "?" "(" ")" "\"")))

;;;========================================================================
(lex.create "finnish")
(lex.set.phoneset "finnish")

;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/lex.lex" )
;;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/festvox/lex.lex" )
;;;(lex.set.pos.map finnish_pos_map) ; turha...
(lex.set.lts.method 'finnish_lts)
;;;(lex.set.lts.ruleset 'finnish) ; turha...

;;;========================================================================
;;(lex.add.entry '("." "punc" ((( # # ) 0 ))))
;;(lex.add.entry '(":" "punc" ((( # ) 0 ))))
;;(lex.add.entry '(";" "punc" ((( # ) 0 ))))
;;(lex.add.entry '("," "punc" ((( # ) 0 ))))
;;(lex.add.entry '("?" "punc" ((( # # ) 0 ))))
;;(lex.add.entry '("!" "punc" ((( # # ) 0 ))))

;;;========================================================================
(lex.add.entry '("a" "char" ((( a: ) 2)))) 
(lex.add.entry '("b" "char" ((( b e: ) 2))))
(lex.add.entry '("c" "char" ((( s e: ) 2)))) 
(lex.add.entry '("d" "char" ((( d e: ) 2))))
(lex.add.entry '("e" "char" ((( e: ) 2)))) 
(lex.add.entry '("f" "char" ((( @ f ) 2))))
(lex.add.entry '("g" "char" ((( g e: ) 2)))) 
(lex.add.entry '("h" "char" ((( h o: ) 2))))
(lex.add.entry '("i" "char" ((( i: ) 2)))) 
(lex.add.entry '("j" "char" ((( j i: ) 2)))) 
(lex.add.entry '("k" "char" ((( k o: ) 2)))) 
(lex.add.entry '("l" "char" ((( @ l ) 2))))
(lex.add.entry '("m" "char" ((( @ m ) 2)))) 
(lex.add.entry '("n" "char" ((( @ n ) 2))))
(lex.add.entry '("o" "char" ((( o: ) 2)))) 
(lex.add.entry '("p" "char" ((( p e: ) 2))))
(lex.add.entry '("q" "char" ((( k u: ) 2)))) 
(lex.add.entry '("r" "char" ((( @ r ) 2))))
(lex.add.entry '("s" "char" ((( @ s ) 2)))) 
(lex.add.entry '("t" "char" ((( t e: ) 2)))) 
(lex.add.entry '("u" "char" ((( u: ) 2)))) 
(lex.add.entry '("v" "char" ((( v e: ) 2))))
(lex.add.entry '("w" "char" ((( k a k ) 2) (( s o i s ) 0) (( v e: ) 1)))) 
(lex.add.entry '("x" "char" ((( @ k s ) 2))))
(lex.add.entry '("y" "char" ((( y: ) 2)))) 
(lex.add.entry '("z" "char" ((( b e: ) 2))))
(lex.add.entry '("�" "char" ((( r u o t ) 2 ) (( s a ) 0 ) (( l a i ) 1 ) (( n e n) 0 )(( o: ) 2)))) 
(lex.add.entry '("�" "char" ((( @: ) 2))))
(lex.add.entry '("�" "char" ((( 7: ) 2)))) 


;;;========================================================================
(provide 'finnish_lex)