2
.TH hunspell 1 "2014. május 27."
5
hunspell \- unicode-os helyesírás\-ellenőrző, szótövező és morfológiai elemző program
7
hunspell [\-1aDGHhLlmnOstvwX] [\-\-check\-url] [\-\-check\-apostrophe] [\-\-help] [\-i karakterkódolás] [\-d szótár[,...]] [\-p sajátszótár] [szöveges/OpenDocument/TeX/LaTeX/HTML/SGML/XML/nroff/troff állomány(ok)]
11
felismeri és javítja az elütéseket és típushibákat
12
egyszerű szöveges, OpenDocument, (La)TeX, XML, HTML és groff (kézikönyv oldal) állományokban.
14
Ha nem adunk meg állománynév-paramétert, a Hunspell az Ispell
15
csőfelületéhez hasonlóan működik: a bemenet sorait szavakra bontja,
16
és *, +, vagy - jellel kezdődő kimeneti sorral jelzi, ha egy szó jó,
17
és # vagy & jellel, ha rossz. A csőfelület parancsait viszont az
18
Ispellhez hasonlóan csak a
20
kapcsoló megadásával értelmezi.
22
Állománynév paraméter esetén elindul egy az Ispelléhez hasonló interaktív felület.
26
Speciális formátum: a bemeneti állomány tabulátorjelet tartalmazó soraiból csak az
27
első tabulátorjel előtti karaktersorozatot vizsgálja meg.
30
Ispellhez csőfelület. A
38
jellel kezdődő sorok a csőfelület parancsai, jelentésüket
39
az Ispell kézikönyvoldal részletezi. A \-a kapcsoló
40
hatására a kimenetben a jó szavakat csak csillaggal jelzi
41
a Hunspell. Ez nagyobb kompatibilitást biztosít az Ispellt használó programok
42
némelyikével (például a LyX-szel). Ekkor nem kell
43
megadnunk a \-a kapcsolót, mivel az Ispellt
44
használó programok automatikusan ezzel a kapcsolóval indítják
45
el az Ispell nevében futó Hunspellt is.
47
.B \-d " szótár[,szótár2,...]"
48
Beállítja a helyesírási szótárakat a
49
kiterjesztés nélküli szótárnevek, útvonalak
54
hunspell \-d hu_HU,hu_geo,hu_med,de_DE,de_med
56
a magyar alapszótárat és kiegészítő szótárait,
57
valamint német alapszótárat és annak egy kiegészítő
58
szótárát tölti be. Az alapszótárak egy aff és egy dic
59
kiterjesztésű állományból állnak, a kiegészítő szótárak
60
csak dic állományból. A kiegészítő szótárak
61
nevére vonatkozóan nincs szabály (csak a dic kiterjesztés),
62
a szótárnevek sorrendje határozza meg, hogy melyik alapszótárhoz
63
töltődnek be a kiegészítő szótárak (ami pedig meghatározza
64
a javaslattevést). Az első szótár mindig alapszótár.
66
Az alapértelmezett szótár a környezet nyelvi beállításától függ
67
az Unix rendszereken. Locale hiányában a
68
.BR /usr/share/hunspell/default
69
az alapértelmezett szótár.
71
A megadott útvonal lehet abszolút és relatív is. Relatív
72
útvonal esetén először az aktuális, majd a
73
.BR /usr/share/hunspell
74
és még több más könyvtárban keresi a szótárt a program. L. \-D és a
78
A keresési útvonalak, az elérhető és betöltött szótárak útvonalának
82
A \-l, \-w, és \-L kapcsolókat kiegészítő kapcsoló. A standard bemenetről
83
érkező hibás szavak, illetve
84
sorok megjelenítése helyett a jó szavak és a hibátlan sorok megjelenítését
85
kérhetjük vele. Ha mást nem adunk meg, a \-l kapcsoló hatásának megfelelően
86
működik, csak a rossz helyett a jó szavakat írja a standard kimenetre.
89
A beépített leírás megjelenítése.
92
HTML bemeneti állományformátum beállítása. Ha az állomány
93
nevének .html vagy .htm a kiterjesztése, ez automatikusan bekövetkezik.
96
Kiírja a hibás szavakat a standard bemenetről érkező állományból.
97
Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló
98
megfordítja a Hunspell működését: csak a jó szavak kerülnek kiírásra.
101
Csak a hibás szavakat tartalmazó sorokat írja ki a standard bemenetről érkező állományból.
102
Használható a \-H, \-t, \-n, \-1 kapcsolókkal együtt is. A \-G kapcsoló
103
megfordítja a működését: csak azok a sorok kerülnek kiírásra, amelyek egy
104
hibás szót sem tartalmaznak.
107
Elemző üzemmód: a bemeneti szövegszavak morfológia elemzése, illetve a szótári
108
morfológiai leírás hiányában a toldalékolt szavak kapcsolóinak
109
kijelzése (szótárfejlesztőknek).
112
Nroff/troff bemeneti állományformátum beállítása, elsősorban a
113
kézikönyvlapok ellenőrzésére.
116
OpenDocument (ODF vagy flat ODF) bemeneti állományformátum beállítása. Ha az állomány
117
nevének .odt, .ods, .odp, .odg, illetve ezek sablon (.ott, ...) vagy flat (.fodt, ...)
118
változatainak megfelelő a kiterjesztése, ez automatikusan bekövetkezik.
119
Ha még nem volna, telepítsük az unzip programot a kapcsoló használata előtt.
121
.B \-p " saját_szótár"
122
A felhasználó saját szótárának beállítására szolgál.
124
Az alapértelmezett saját szótár a
125
.BR $HOME/.hunspell_default
126
állomány. Ha szótárat is megadunk a
130
környezeti változóval, a saját szótár a
131
.BR $HOME/.hunspell_szótárnév
132
lesz. Ha a saját szótár nem létezik, létrehozza.
134
Ha az aktuális könyvtárban is van egy ugyanilyen nevű
135
állomány, akkor annak tartalma is beolvasásra kerül,
136
mint saját szótár, és az újonnan felvett szavak is
143
környezeti változó megadásával új saját szótárat
144
jelölünk ki. A saját szótárat az aktuális könyvtárban,
145
és a saját könyvtár gyökerében ($HOME) keresi a
146
Hunspell. Ha nem található, akkor az újonnan felvett
147
szavak mentésénél létrehozza a saját könyvtár gyökerében.
150
Tövező üzemmód: a bemenő szövegszavak tövezése (a szótártól függő
154
LaTeX bemeneti állományformátum beállítása. Ha az állomány nevének .tex
155
a kiterjesztése, ez automatikusan bekövetkezik.
158
Tipikus hibák kijelzése az állományból, cserejavaslattal.
161
Tipikus hibák és javításuk kijelzése módosítható, és a
162
sed programmal végrehajtatható formában.
163
Irányítsuk a Hunspell kimenetét egy állományba.
164
Törüljük azokat a sorokat az elmentett állományból,
165
amelyek sed paranccsal megadott javítását nem szeretnénk.
166
Mentsük el az állományt, és
167
a \fIsed -f javítás eredeti_állomány >javított_állomány\fR
168
paranccsal javíthatjuk az állományt gyorsan
169
és egyszerűen. (A sok hibát tartalmazó állományok
170
javítását gyorsítja meg ez a lehetőség.)
173
Ha az -u kapcsolóval kapott javaslatokat mind el szeretnénk fogadni,
174
akkor az \-U kapcsolóval a Hunspell automatikusan
175
végrehajtja a cseréket, és a módosított állományt
176
a szabványos kimenetre küldi. Példa a javításra:
177
\fIhunspell -U eredeti_állomány >javított_állomány\fR.
178
A hibakimeneten megjelennek a javítások is még egyszer, a
179
-\u kapcsolóhoz hasonló módon.
185
Verziószám (Ispell kompatibilitás miatt).
188
Csak a hibás szavakat írja ki a standard bemenetről érkező, soronként
189
egy szót tartalmazó állományból. A sorok nincsenek szavakra
190
bontva. A sorok szavakra bontása, és csak a hibás szavak kiírása a \-w kapcsolóval
191
érhető el. A \-G kapcsoló megfordítja a Hunspell működését: csak a jó szavak kerülnek
195
XML bemeneti állományformátum beállítása. Ha az állomány
196
nevének .xml a kiterjesztése, ez automatikusan bekövetkezik.
197
.SH INTERAKTÍV FELÜLET
198
A felület legfelső sorában a hibás szóalakot, és az éppen vizsgált
199
állomány nevét látjuk. Amennyiben egy szóalak szótári tiltás
200
miatt nem kerül elfogadásra, a bal felső sarokban a TILTOTT!
201
(FORBIDDEN!) üzenet is megjelenik. Ez az üzenet arra utal, hogy nem
202
hiányos szókincs, hanem szándékos tiltás miatt nem került a szó
203
elfogadásra. Az első sor alatt az állomány hibás szót tartalmazó sorát, és
204
szövegkörnyezetét láthatjuk, majd ezt követik a javaslatok, ha vannak.
206
A használható billentyűkombinációk:
209
Továbblépés javítás nélkül a következő hibás szóra.
212
A megfelelő javaslat kiválasztása.
215
Csere. A hibás szó cseréje a megadott szóra, vagy szavakra.
216
Az Escape billentyű kétszeri lenyomásával megszakíthatjuk a
220
A szó elfogadása a program futásának befejeződéséig.
223
A szó felvétele a saját szótárba.
226
A szó kisbetűsként való felvétele a saját szótárba.
229
Ragozott tőszó felvétele. A ragozás a másodikként
230
megadott, mintául szolgáló szó alapján történik.
231
Ha ez a szó nincs felvéve a szótárba, a tőszófelvételt
232
elölről kell kezdeni.
234
Példa: gyakran hiányoznak az idegen és a
235
mozaikszavak. Vegyük fel a hiányzó OTP szót
236
a tv köznévi mozaikszó toldalékaival!
237
Lenyomjuk a t billentyűt, beírjuk, hogy OTP,
238
leütjük az új sor billentyűt, beírjuk, hogy tv, és ismét új sor. A tv szó
239
ugyanis már szerepel a szótárban, és ragozása
240
mondja meg a programnak, hogy az OTP szót
241
milyen toldalékokkal szeretnénk látni, pl.
242
OTP\-hez, OTP\-met stb. a tv\-hez, tv\-met mintájára.
243
A \-val/\-vel, \-vá/\-vé toldalékokat
244
a kötőjellel kapcsolt toldalékú szavak
245
esetében külön kell felvenni, de még így is sokkal
246
kényelmesebb a speciális tőfelvétel, mint minden
247
(akár több száz) toldalékos alakot külön\-külön
250
Egy kis segítség a minta kiválasztásához:
251
első menetben a hangrend számít. Pl. mozaikszavaknál a
252
mély hangrendű új szavak felvételénél használhatjuk
253
a \fIMÁV\fR szót példaként, ajakréses magas hangrendnél
254
pedig az említett \fItv\fR\-t. Ajakkerekítéses magas hangrend
255
esetében a \fIHÖK\fR szót használhatjuk (amíg át nem
256
lesz javítva a helyes hök\-re). Ha a hiányzó
257
szó nem mozaikszó, hanem például tulajdonnév,
258
a \fIPál\fR, \fIPéter\fR, \fIÖrs\fR szavakat adhatjuk
259
meg példának a hangrendtől függően. Ha meg
260
egyszerű köznévről van szó, akkor használjuk az
261
\fIok\fR, \fIék\fR, \fIük\fR szavakat.
262
Igéknél \fIáll\fR, \fIvél\fR, \fIül\fR,
263
ikes igéknél \fIázik\fR, \fIvérzik\fR, \fInőzik\fR
264
lehet a példa (remélhetőleg a következő
265
változatokban egyszerűsödik ez a tőfelvétel).
267
Az Escape billentyű kétszeri lenyomásával megszakíthatjuk ezt
270
Az itt felvett szavak automatikusan a saját
271
szótárba kerülnek. Ha ezt innen törölni
272
szeretnénk, a programból kilépve
273
a saját szótár kézi átszerkesztésével tehetjük meg.
277
Kilépés a változtatások mentése nélkül. A program
278
változtatás megléte esetén megerősítést kér.
281
Az állomány ellenőrzésének megszakítása a változtatások
282
mentésével. Ha van következő állomány, akkor
283
a program annak ellenőrzését kezdi el.
286
Segítség. Hasonló rövid leírás megjelenítése a
287
billentyűparancsokról.
289
A \fIHunspell \fR soronként dolgozza fel az
290
állományokat, a helyes szavakat \fI*\fR (tőszó), \fI\-\fR
291
(összetett szó), vagy
293
(ragozott szó) karakterrel jelöli, a helyteleneket
295
(nincs javaslat) , vagy
297
(van javaslat) karakterrel. A + jelet a kimenetben követi még a szótő.
298
A # jel után a hibás szó, és kezdőpozíciója van feltüntetve.
299
A & jelet követi a hibás szó; a javaslatok száma; a hibás szó
300
kezdőpozíciója; majd kettőspont után a javaslatok, vesszővel elválasztva:
313
& macka 7 0: macska, maca, racka, packa, vacka, marka, mackó
318
.B hunspell \-d en_US english.html
319
Az amerikai angol helyesírási szótár kiválasztása (aktuális, vagy a
320
.BR /usr/share/hunspell
323
.B hunspell -l szöveg.html
324
A megadott állomány hibás szavainak kiírása.
326
.B hunspell -l *.odt | sort | uniq >nem_ismert_szavak
327
Az aktuális könyvtárban található összes OpenDocument szöveges állomány
328
nem ismert szavainak állományba mentése (az ismétlődők kiszűrésével).
330
.B hunspell -p nem_ismert_szavak_de_jok *.odt
331
Az aktuális könyvtárban található OpenDocument szöveges állományok
332
interaktív ellenőrzése saját szótár megadásával. A példában szereplő
333
saját szótár nem más, mint az előzőleg elmentett nem_ismert_szavak állománya,
334
amelyekből kivettük azokat a szavakat, amelyeket most javítani szeretnénk.
338
A szótár helyének megadására szolgál. Szerepe megegyezik a
343
A szótárkeresési útvonalat tartalmazó változó.
346
A saját szótár helyének megadására szolgál. Szerepe megegyezik a
350
.BI /usr/share/default.aff
351
Az alapértelmezett ragozási táblázat. Lásd hunspell(4).
353
.BI /usr/share/default.dic
354
Az alapértelmezett szótár az előző ragozási táblázathoz.
356
.BI $HOME/.hunspell_default
357
Az alapértelmezett saját szótár. Az állományt létrehozza
358
a Hunspell, ha nem létezik. Lásd ispell(1).
366
Magyar Ispell dokumentáció.
368
A program a következő előnyöket nyújtja a hasonló célokat szolgáló \fIIspell\fR\-lel szemben:
370
Képzők átfogó ismerete. (Több tízezer helyes szóalak elfogadását tette
371
lehetővé a tesztelésre használt 4 millió szavas gyakorisági szótárban.)
373
Homonimák kezelése (nincsenek például olyan alakok elfogadva, mint megvárban).
375
Helyes javaslatok a több karakter változásával járó tipikus hibákra
376
(j/ly, íj/ijj, nyj/nny és még több tucatnyi tévesztés megvizsgálásával).
377
Az \fIIspell\fR csak két karakter felcserélése; vagy egy karakter hiánya,
378
cseréje, illetve felesleges jelenléte esetén ad helyes javaslatot.
380
Az összes helyes összetett szónak látszó, de tipikus hibával előálló alak tiltása (karvaj, színtű, súlytó stb.)
382
Javaslatok valószínűségi sorrendben jelennek meg (tipikus hibák, i/í, o/ó, u/ú tévesztések stb.).
384
Összetett szavak esetén 6–3\-as szabály alkalmazása (helyesírás\-ellenőrző, gépkocsi\-összeszerelés).
386
Mozgószabály alkalmazása (kiviteli engedély, kiviteliengedély\-kérés).
388
A magyar nyelv egyéb összetételi szabályainak alkalmazása (például hatlövetű, tizenkét lövetű, kéthavi, két hónapos, másodmagával).
390
Leg-, legesleg- és -bb confixum helyes kezelése (nincs pl. legédes, csak legédesebb).
392
Ragozható tőszófelvétel. Megkönnyíti egy új szó ragozott változatainak ellenőrzését, feleslegessé téve ezek külön\-külön történő felvételét a saját szótárba.
394
Javaslatok mássalhangzó\-triplázások (sakkkör, baletttáncos, dzsesszszak) esetén.
395
(Ispell helyesnek fogadja el ezeket.)
397
Javaslatok szótagduplázások (oktatatás, igenenevet) esetén.
399
Javaslatok ékezet nélküli szövegre (tukorfurogep\->tükörfúrógép).
401
Kötőjeles szavak kezelése (unos\-untalan).
403
Toldalékolt számok (1\-jén, 11\-én, 5.\-et) kezelése.
405
°, %, és § jelek (%\-kal) toldalékolt alakjainak kezelése.
407
Mozaikszavak (MÁV\-osokat) kezelése.
409
Y-ra végződő szavak (boyjal, pennyvel) kezelése.
411
Idegen ejtésű szótagra végződő szavak (Anonymusszal, Voltaire\-nek) kezelése.
413
Két szóból álló földrajzi nevek (San Franciscó\-i) kezelése.
415
Hibás alakok tiltása (Babitssal, tanit, alkotóművész stb.)
417
Tiltások jelzése a felhasználói felületen.
419
Egyéb (például az Ispell ragozott utószó esetében bármilyen szóösszetételt elfogad: macskatekerem, kutyakavarom, ezt a Hunspell nem teszi meg).
421
Magyar nyelvű (illetve
425
Hordozható szöveges szótárállományok, szemben az Ispell platform, és bináris Ispell fordítástól függően (nem) kezelhető adatállományaival.
428
A Hunspell az OpenOffice.org MySpell függvénykönyvtárán továbbfejlesztése.
429
A MySpell affixumtömörítésének mintája az International Ispell program volt.
431
A mintaként szolgáló International Ispell szerzője Geoff Kuenning,
432
sok más elődje munkájára támaszkodva (l. ispell(1)).
434
A Myspellt Kevin Hendricks készítette a legjelentősebb
435
nyílt forráskódú irodai csomaghoz, az OpenOffice.org-hoz 2001\-2002\-ben
436
(l. http://hu.openoffice.org).
438
A Hunspell programkönyvtárat és parancssori programot
439
Németh László <nemeth@openoffice PONT org> készítette 2002\-2008\-ban.