blob: 2a98ae2831154fdf81a9dd88729b4ad22a8d3b05 (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
|
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; ;;
;;; Department of General Linguistics / Suopuhe project ;;
;;; University of Helsinki, FI ;;
;;; Copyright (c) 2000-2003 ;;
;;; All Rights Reserved. ;;
;;; ;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;; ;;
;;; Finnish lexicon for function word determination ;;
;;; ;;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;
; Authors: Nicholas Volk & Martti Vainio
;
; This program is distributed under Gnu Lesser General Public License (cf. the
; file LICENSE in distribution).
; This program is free software; you can redistribute it and/or modify
; it under the terms of the GNU Lesser General Public License as published by
; the Free Software Foundation; either version 2 of the License, or
; (at your option) any later version.
; This program is distributed in the hope that it will be useful,
; but WITHOUT ANY WARRANTY; without even the implied warranty of
; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
; GNU Lesser General Public License for more details.
(define (word_list_entry? word lexicon)
"(word_list_entry? STRING LIST)
Checks whether the STRING is member of any of the sublists of LIST."
;; (format stderr "%s in %l?\n" sana (car leksikko))
(cond
((null lexicon)
nil)
((member_string word (cdr (car lexicon)))
t)
(t
(word_list_entry? word (cdr lexicon)))))
(set! doubler_words
'((a terve tuore )
(n aihe aste kone laite lause luode n�yte oire puhe purje tunne vene virhe)
(v aja auta mene ole ota pue pure sy� tule ))
)
(set! finnish_guess_coord
'((coord ja tai vai)))
(set! finnish_guess_cop
'(
(cop
olen olet on olemme olette ovat olla ole olleet ollut
olin olit oli olimme olitte olivat
olisin olisit olisi olisimme olisitte olisivat
lienen lienet lienee lienemme lienette lienev�t liene lienneet)))
(set! finnish_guess_pron
'(
(pron
min� sin� h�n me te he se ne
minun sinun h�nen meid�n teid�n heid�n sen niiden niitten
minua sinua h�nt� meit� teit� heit� sit� niit�
minut sinut h�net meid�t teid�t heid�t
minusta sinusta h�nest� meist� teist� heist� siit� niist�
minussa sinussa h�ness� meiss� heiss� siin� niiss�
minuun sinuun h�neen meihin teihin heihin siihen niille
minulla sinulla h�nell� meill� teill� heill� niill�
minulta sinulta h�nelt� meilt� teilt� heilt� niilt�
minulle sinulle h�nelle meille teille heille sille niille
m� mun mua mut mussa muhun mulla mulle
s� sun sua sut sussa susta suhun sulla sulta sulle
t�m� t�m�n t�t� t�ss� t�st� t�h�n t�ll� t�lt� t�lle t�n�
n�m� n�iden n�itten n�it� n�iss� n�ist� n�ihin n�ill� n�ilt� n�ille n�in�
tuo tuon tuota tuossa tuosta tuohon tuolla tuolta tuolle tuona
nuo noiden noitten noissa noista noihin noilla noilta noille noina
joka jonka jota jossa josta johon jolla jolle jolta jona
jotka joiden joita joissa joista joihin joilla joilta joille joina
mik� mink� mit� miss� mist� mihin mill� milt� mille miksi
minne t�nne sinne jonne
kuka ket� kenen keness� kenest� keneen kenell� kenelt� kenelle
ken keit� ketk� keiden keitten keiss� keist� keihin keill� keilt� keille
kumpi kumpaa kumman kummassa kummasta kumpaan kummalla kummalta kummalle kumpana
)))
(set! finnish_guess_pos
'(
(copula
olen olet on olemme olette ovat olla ole olleet ollut
olin olit oli olimme olitte olivat
olisin olisit olisi olisimme olisitte olisivat
lienen lienet lienee lienemme lienette lienev�t liene lienneet)
(coord
ja tai vai)
(neg
en et ei emme ette eiv�t)
(xxx
ali alla allaan alle alleen alta
and
edelle edelleen edell� edell��n edess� edess�mme edess�ni edess��n edest� edest��n
ehkei
eli
ellei ellen
ennen
eteen
ettei etteiv�t etten
ett�
huolimatta
ilman
joko
jokunen
jollei jolleiv�t
jos
j�ljess� j�lkeen j�lkeens�
kanssa
kautta kauttaan
kera
kerran
keskelle keskell� keskelt� kesken
kohti
koska
kuin
kun
luokse luokseen luona luota luotasi
l�helle l�hell� l�helt� l�hettyville
l�htien
l�pi
miksei
mik�li
mutta muttei
ohella ohessa
ohi ohitse ohitseni
olemaan olemassa olemasta olematta oleva olevaa olevaan olevalla olevalle olevamme olevan olevani olevansa olevassa olevasta olevia olevien oleviin oleville olevissa olevista olkoon ollaan ollakseen olleelle olleen olleensa olleeseen olleessa olleiden olleille olleisiin olleissa olleista olleita ollen ollenkaan ollessa ollessaan ollessani ollutta oltaisiin oltaisiinko oltava oltu oltua oltuaan
paitsi
pitkin
poikki
p�in p��lle p��lleen p��ll� p��lt��n
riippumatta
saati
sek�
suhteen suhteensa
taakse taakseen
takaa takana takanaan
vaan
vaikka vaikkei
vailla vaille
varrella varrelta varressa varresta varteen
vastap��t�
vasten vastoin
yli ylitse
ymp�ri
ynn�
�lk�� �lk��n
)
(punc
"." "," ":" "!" "?" "(" ")" "\"")))
;;;========================================================================
(lex.create "finnish")
(lex.set.phoneset "finnish")
;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/lex.lex" )
;;(lex.set.compile.file "/home/n/v/nvolk/festival/lib/voices/finnish/hy_fi_mv_diphone/festvox/lex.lex" )
;;;(lex.set.pos.map finnish_pos_map) ; turha...
(lex.set.lts.method 'finnish_lts)
;;;(lex.set.lts.ruleset 'finnish) ; turha...
;;;========================================================================
;;(lex.add.entry '("." "punc" ((( # # ) 0 ))))
;;(lex.add.entry '(":" "punc" ((( # ) 0 ))))
;;(lex.add.entry '(";" "punc" ((( # ) 0 ))))
;;(lex.add.entry '("," "punc" ((( # ) 0 ))))
;;(lex.add.entry '("?" "punc" ((( # # ) 0 ))))
;;(lex.add.entry '("!" "punc" ((( # # ) 0 ))))
;;;========================================================================
(lex.add.entry '("a" "char" ((( a: ) 2))))
(lex.add.entry '("b" "char" ((( b e: ) 2))))
(lex.add.entry '("c" "char" ((( s e: ) 2))))
(lex.add.entry '("d" "char" ((( d e: ) 2))))
(lex.add.entry '("e" "char" ((( e: ) 2))))
(lex.add.entry '("f" "char" ((( @ f ) 2))))
(lex.add.entry '("g" "char" ((( g e: ) 2))))
(lex.add.entry '("h" "char" ((( h o: ) 2))))
(lex.add.entry '("i" "char" ((( i: ) 2))))
(lex.add.entry '("j" "char" ((( j i: ) 2))))
(lex.add.entry '("k" "char" ((( k o: ) 2))))
(lex.add.entry '("l" "char" ((( @ l ) 2))))
(lex.add.entry '("m" "char" ((( @ m ) 2))))
(lex.add.entry '("n" "char" ((( @ n ) 2))))
(lex.add.entry '("o" "char" ((( o: ) 2))))
(lex.add.entry '("p" "char" ((( p e: ) 2))))
(lex.add.entry '("q" "char" ((( k u: ) 2))))
(lex.add.entry '("r" "char" ((( @ r ) 2))))
(lex.add.entry '("s" "char" ((( @ s ) 2))))
(lex.add.entry '("t" "char" ((( t e: ) 2))))
(lex.add.entry '("u" "char" ((( u: ) 2))))
(lex.add.entry '("v" "char" ((( v e: ) 2))))
(lex.add.entry '("w" "char" ((( k a k ) 2) (( s o i s ) 0) (( v e: ) 1))))
(lex.add.entry '("x" "char" ((( @ k s ) 2))))
(lex.add.entry '("y" "char" ((( y: ) 2))))
(lex.add.entry '("z" "char" ((( b e: ) 2))))
(lex.add.entry '("�" "char" ((( r u o t ) 2 ) (( s a ) 0 ) (( l a i ) 1 ) (( n e n) 0 )(( o: ) 2))))
(lex.add.entry '("�" "char" ((( @: ) 2))))
(lex.add.entry '("�" "char" ((( 7: ) 2))))
;;;========================================================================
(provide 'finnish_lex)
|