por konciza enkonduko kun bildoj vidu
www.iei.nl/nova teknologio_espe.htm

Lastaj novaĵoj (Versio 0.95)

Komence de Februaro 2009 pretiĝis ESPSOF 0.95. La ĉefa novaĵo en ĉi tiu nova versio estas la elektebleco de la vorttrezoro, laŭ kiu la uzanto deziras kontroli iun tekston.

Prezentado de ESPSOF ĉirkaŭ la Universala Kongreso de 2008 rezultigis komenton pri la bezono de literumilo kun strikte limigita anstataŭ ampleksa vortaro, speciale ĉe verkistoj de artikoloj aŭ libroj celitaj al komencantoj. Tial, por fari ESPSOF efikan ilon ankaŭ ĉe tia diverseco de uzantoj, la nuna Versio 0.95 ebligas elekti inter jenaj kvar opcioj, kiam oni startigas la programon:

  • Opcio I:     52.000 vortoj (tuta PIV kaj aldona vortaro 'Dict3')
  • Opcio II:    41.000 vortoj (tuta PIV)
  • Opcio III:   10.000 vortoj (nur ĉiutagaj kaj oficialaj vortoj el PIV)
  • Opcio IV:     2.200 radikoj (Baza Radikaro Oficiala)

Notu ke ĉe ĉiu Opcio, krom la indikita nombro da vortoj aŭ radikoj, ESPSOF aprobos ankaŭ kunmetaĵojn faritajn el ili. Opcio I restas la defaŭlta opcio, kiel ĝi jam estis en la ĝisnunaj ESPSOF-versioj. Ĝia speciala aldona vortaro 'Dict3' enhavas nur kelkcent neologismojn sed kelkmil kunmetaĵojn, kies inkludo povas altigi la sukcesgradon kaj rapidecon de tekstanalizo.

Aliaj novaĵoj en Versio 0.95 estas aŭdio-signalado de i.a. fremdlingvaj vortoj, pritrakto de piednotoj aŭ finaj notoj en la (MS-WORD) fontotekstdosiero, kaj resuma statistiko pri vortlongoj. Plue, cele al bona - intermorfema - vortotranĉado ĉe la fino de skriblinio, aŭtomata enmeto de kaŝita dividstreko ('Optional hyphen') en vortoj de minimume 12 literoj estas aranĝita.

Kiuj kaj kio?

ESPSOF estas pakaĵo de programaro por kontroli kaj analizi tekstojn en Esperanto. Ĝi taŭgas speciale por reviziado kaj vortstatistika analizo de longaj tekstoj: gazetartikoloj, eseoj, literaturaj verkoj, ĉu skanitaj, ĉu entajpitaj.

La softvarpakaĵo estas farita de Toon Witkam (ESPSOF.tw@gmail.com) kaj ĝi kongruas kun Vindozo 2000/XP/VISTA kaj kun Microsoft Office 2000/2002/2003/ 2007 WORD kaj EXCEL, ĉar ĝi estas kodita en VBA 6.0 (Visual Basic for Applications).

Ĉe fontoteksto en MS-WORD, la kontrol- kaj analiz-rezultoj de ESPSOF aperos parte en WORD (ruĝigo de eraraj vortoj), parte en EXCEL (vortlistoj kun statistikaj kaj morfologiaj datumoj, konkordancoj, ktp).

Por konstrui kaj pluevoluigi la ESPSOF-pakaĵon, surreta leksika softvaro de Edmund Grimley Evans (BRO, NPIV 2004), de Hirotaka Masaaki kaj Ono Takao (DENTAN), kaj de Thommy Schuetz (www.thschuetz.de) estis uzata. Dank’ al tio, la interna vorttrezoro de la pakaĵo (en EXCEL) jam ampleksas ĉirkaŭ 52.000 vortojn entute . Ĉe la inkludo de ne-enPIVaj vortoj, ofte la bona vortaro de Erich-Dieter Krause (Großes Wőrterbuch Esperanto-Deutsch, 1999), fojfoje ankaŭ tiu de Okelmann (Wőrterbuch Esperanto-Deutsch, 1993) kaj krome Google kaj Komputeko (Yves Nevelsteen) estas konsultitaj pri la akceptebleco kaj uzado de vorto. La findecido ĉu jes aŭ ne inkludi ne-enPIVan vorton pleje estis subjektiva, kaj respondecas por ĝi la ESPSOF-farinto.

La nuna Versio 0.95 de ESPSOF estas disponebla al (prov-)uzantoj. Ĝi ebligas reviziadon (kontrolon pri eraroj), surekranan indikadon de morfemlimoj, bazan sintaksan analizon, kaj konkordancfaradon. Por la aranĝo videbligi laŭdezire ĉiujn morfemlimojn inspiris min Horst Renemann.

La intenco estos distribui nekomerce kaj malfermitkode ankaŭ estontajn versiojn de ESPSOF.

Literumilo aŭ reviziilo?

Anstataŭ kontroli aŭ korekti vortojn dum tajpado, ESPSOF nur kontrolas la tekston post tajpado. Ĝi do funkcias kiel revizianto. Kompare al la homa revizianto, la elektronika helpanto unuflanke havas klarajn mankojn: ĝi tute ne rimarkas tiujn mistajpitajn vortojn, kiuj hazarde iĝis alian ekzistantan vorton, kvankam tute sensencan en la kunteksto. Aliflanke, ĝi bone notas la eraretojn kiujn la homa provleganto pretervidas: mankantan supersigno (autoritato, rica), ciferon 1 anstataŭ literon l (ĉe skanita teksto), ktp.

Notu, ke ESPSOF estas por veraj tekstoj, ne por listoj, tabeloj, datumbazoj. Ĝi estas por tekstoj, kiuj ekzistas el frazoj, kun ĝusta interpunkcio (helpsignoj) kaj ĝusta - plimalpli tradicia - uzo de majuskloj. Ĝi ne taŭgas por rapide entajpita retpoŝto, mobiltelefonmesaĝoj kaj aliaj senzorge skribitaj komputiltekstaĵoj, en kiu interpunkcio kaj majuskligo mankas aŭ fuŝas.

Tio ne signifas ke ESPSOF tute ne povus prilabori modernajn tekstojn en kiuj fojfoje aperas retadresoj aŭ ekz. modesta tabelo. Ĝi tamen ĝenerale ne taŭgas por tutaj retpaĝoj, afiŝoj, kalkulfolioj ktp.

La forto de ESPSOF estas ĝia kapableco prilabori ampleksajn tekstojn: tutaj libromanuskriptoj de pli ol 100.000 vortoj ne estas problemo. Kaj krom erarruĝigo en la fontoteksto, ankaŭ la rezultaj listoj en aparta EXCEL-dosiero kontribuas al eraratentigo.

En la plua priskribo de ESPSOF, ‘tekstkontrolilo’ kaj ‘tekstanalizilo’ estas uzataj kiel sinonimaj vortoj.

Krom tekstkontrolilo estas en la pakaĵo ankaŭ konkordancilo, nomita ‘KVEK’ (Konatigi Vortojn en Kunteksto). Ĝi povas helpi se, dum la reviziado, oni volas rigardi la ĝustan uzon de certaj vortoj.

Reiru supren

 

Kunmetaĵoj analizitas

Speciala trajto de ESPSOF kompare al diversaj literumiloj, en kaj ekster Esperantio, estas ĝia povo analizi ankaŭ ne-envortarajn vortkunmetaĵojn.

Tiucele la ESPSOF-programaro fakte funkcias ne surbaze de vortoj, sed surbaze de morfemoj. En ĝia internaj vortaroj ĉiu vorto havas morfemstrukturon eksplicitan, kaj tio faciligas analizon de kunmetado per afiksoj aŭ finaĵkompleksoj (biciklingo, eksbazestrojn, reprograminto). Koncerne kunmetaĵojn kiuj estas tute ne-envortaraj (ĉasirado, fruktokulturistoj, pripensindaĵaro), kontrolo de ilia senerareco postulas morfemdisigon, aŭ pli ĝuste dirite: la eblajn morfemdisigojn, ĉar ofte eblas pluraj.

La rezultaj vortlistoj en EXCEL, kiujn ESPSOF produktas, montras ankaŭ la morfemstrukturon de la kontrolitaj vortoj. Kaj per speciala opcio por la uzanto, la morfemlimoj videblas krome en la kontrolita fontoteksto mem, laŭelekte en ĉiuj vortoj aŭ nur en ne-envortaraj kunmetaĵoj. Avantaĝo de tio estas, ke oni povas prezenti tekston en formo pli konvena el edukada vidpunkto.

Videbleco de morfemlimoj (per malgrandaj indikiloj) havas jenan aldonan avantaĝon dum la reviziado: hazarde korekta (do ne-ruĝigita) rezulto de mistajpo pli bone videblas, pro apero de suspektaj morfemoj, ekz:

gen-til-a (verŝajne celita vorto: ĝentila)
ten-dec-o (verŝajne celita vorto: tendenco)
intu-ic-o (verŝajne celita vorto: intuicio)
hist-or-ist-o (verŝajne celita vorto: historiisto)

Cetere, morfemdisigo malkaŝanta formale korektan sed sence absurdan kunmetaĵon povas ankaŭ okazi ĉe ĝuste tajpita sed ne-envortara vorto, ekz:

fot-o-tro-pi-o (fontoteksta vorto: fototropio)
am-pli-fik-i (fontoteksta vorto: amplifiki )
an-e-mosk-op-o (fontoteksta vorto: anemoskopo )

Reiru supren

 

Mankoj kaj limoj

Tekstvortoj malĝustaj - ĉu pro tajperaro, skaneraro aŭ erara vortkono - aperos ruĝigitaj, kun kurbigita substreko:

La famaj de la arto kaj scienco…

La mankoj de la tekstkontrolilo estas:

Se tajp- aŭ skan-eraro hazarde rezultigas alian ekzistantan vorton, la maŝino ne konstatas la eraron. En ekzemple

La famaj korofeoj de la arto kaj scienco…

la mistajpo de korifeoj rezultigis la formale korektan kunmetaĵon korofeoj (kor-o-fe-oj). Simile, ĉe mistajpo de la vorto ĝentila rezultas la kunmetaĵon gentila (gen-til-a).

Analizo de ne-envortaraj kunmetaĵoj havas jenan limon: maksimumon de 3 envortaraj unuoj (radikoj aŭ mem kunmetaĵoj). Do ekzemple

eksbazestrarano

estas sukcese analizita (eks-baz-estr-ar-an-o) ĉar eks, bazo, kaj estrarano staras en la vortaro. Kontraŭe,

kvankam formale korekta kunmetaĵo, estas indikita kiel eraro, ĉar la nombro de envortaraj unuoj estas 4.

La rimedo por malpligrandigi tiun mankon estas: aldoni certajn bazajn terminoj, uzatajn en iu fako, entrepreno aŭ institucio(ekz. bazestro) al la ESPSOF-vortaroj en venontaj versioj.

Ĝenerale, la aŭtomata rekono de morfemlimoj en ne-envortaraj kunmetaĵoj ne estas centprocente perfekta. La sukcesgrado nun estas pli ol 97% [vidu pri tio ankaŭ: Toon Witkam, “La ekscito de vortstatistiko: Kiel krudforta kunmet-analizo kompletigas tekstkontrolon”, Aktoj de la 28-a Esperantologia Konferenco en la 90-a Universala Kongreso de Esperanto, Vilno 2005]. Estonta altigo de la sukcesgrado eblas, ĉefe per aldono al ESPSOF de pluaj kunmetaĵoj, en ĝia kroma vortaro ‘Dict3’.

Senkonsidere kunmetaĵojn, la nuna ESPSOF-vorttrezoro (eĉ Opcio I), kvankam ampleksa, ne entenas ĉiujn Esperantajn vortojn: mankos ĉiam diversaj novaj vortoj (neologismoj).

La identigo de sintaksaj roloj (Subjekto, Verbo, Objekto) en la nuna Versio 0.95 povas fojfoje esti malĝusta. Ĉe la konstruado de la koncerna softvaro, strategiprincipo tamen estis prefere rezigni pri analizo de iu fraz(part)o ol riski eraron.

Reiru supren

 

Propraj nomoj

- Propraj nomoj komplikas lingvan tekstkontrolon. ESPSOF en la nuna stato enhavas envortaran liston de ĉirkaŭ kvincent propraj nomoj (ĉefe geografiaĵoj), dum senlima estas la nombro de ĉiuspecaj nomoj (asimilitaj kaj ne-asimilitaj) kaj akronimoj kiuj povas aperi en teksto.

- Majuskligo en teksto helpas, sed ne frazkomence. Se ESPSOF konstatas, ke frazkomenca vorto nek troveblas en ĝia vortaro, nek en ĝia PropraNom-listo, nek inter jam frazmeze trovitaj (majuskligitaj) propraj nomoj en la sama teksto, ĝi faras la frazkomencan vorton rozkolora, sen substreko:

Ben estis nova najbaro, kiu devenis el alia provinco.

Se en la sekva parto de la teksto, tiu suspekta vorto reaperas (majuskligita, kaj ne-frazkomence), ESPSOF forviŝas tiun antaŭa(j)n rozkolorigo(j)n.

- Plua komplikaĵo estas, ke eĉ normalaj lingvaj vortoj kiel ekz. Apud, Barono, Sed, Tiam, hazarde povus esti propraj nomoj. En la nuna versio, ESPSOF konsideras tiujn vortojn ĉiam lingvaj, se frazkomencaj.

- Tre praktika avantaĝo de ESPSOF estas, ke ĝi laŭalfabete listigas ĉiujn proprajn nomojn aperintajn en kontrolita tekstdosiero. Tiun liston ĝi postlasas en EXCEL rezultdosiero kun la sama nomo kiel la fontotekst-dosiero. Ofte, trarigardo de tiu listo remarkigas tajperarojn pli rapide ol trarigardo de la tekstpaĝoj.

Reiru supren

 

FrazKomencMarkoj: apogiloj kaj referenciloj

Ĉe tekstkontrolo aŭ iu ajn alia tekstpritraktado, ESPSOF - dum ĝi antaŭtrairas tra la WORD dosiero - metas specialajn markojn ĉe la komenco de ĉiu frazo en la teksto. Ĉi tiuj markoj havas la formon:

{23-6.,15}

en kiu ekz. 23 estas la numero de alineo, 6 la numero de frazo en tiu alineo, kaj 15 la nombro da vortoj en tiu frazo. Tial ĉi tiuj markoj nomiĝas ankaŭ AFM (Alineo- kaj Fraz-Markiloj) aŭ AZM (nederlandlingve: Alinea- en Zins-Markeerder).

Tiuj FrazKomencMarkoj servas unue kiel stirkampoj [control fields] kaj certigas solidan trairon de ĉiu ESPSOF kontrolilo aŭ analizilo tra la tuta WORD fontotekst-dosiero. Due, la FrazKomencMarkoj povas servi kiel referencaj kampoj [reference fields], kiam rezultlistoj de la analizo (ekz. ĉe la konkordancilo KVEK) referencas al lokoj en la teksto. Tio tre faciligas pritraktado de tekstdosieroj de kelkcent mil vortoj.

Post la uzo de ESPSOF, la uzanto ĉiam havas la eblecon, kaŝi aŭ forviŝi la FrazKomencMarkojn en la pritraktita tekstdosiero [por detaloj vidu sube ĉe “Post la tekstanalizo”].

Reiru supren

 

Instalo de ESPSOF 0.95 - VBA-modjuloj

En WORD iru al ‘Microsoft Visual Basic’ (Alt-F11) kaj maldekstre en la ‘Project’-fenestro alklaku ‘Normal’. Tie, per la dekstra musbutono aperigu ŝprucmenuon, en kiu vi alklaku ‘Import File’ por importi la 5 ESPSOF-dosieroj:

EspKONTR.bas, EspWSTAT.bas, EspSINTAKS.bas,
EnigoTEKSTanal.frm, EnigoKVEK.frm

Post kiam la tiuj ĉi kvin modjuloj aperas en la ‘Project’-fenestro kiel ‘Modules’ aŭ ‘Forms’, iru al la plej supra menutrabo en la Visual Basic ekrano kaj alklaku ‘File’ kaj ‘Save Normal’.

Konservu la supre-menciitajn 5 dosierojn kiel rezervajn modjulojn, kaj krome la dosierojn “EnigoTEKSTanal.frx” kaj “EnigoKVEK.frx”, prefere en dosierujo nomita C:\ESPSOF.

Atentu, ke la ESPSOF-dosieroj “ESPSOF-VORTAR.xls” kaj “ESPSOF-REGREZ.xls” nepre estu en dosierujo nomita “C:\ESPSOF”, alie la tuta pakaĵo ne funkcios.

En la sama dosierujo, por uzi ankaŭ la konkordanc-aplikon KVEK, vi krome bezonas la dosieron “ESPSOF-KVEK.xls”. Tiu dosiero enhavas ĝiajn proprajn du makroomodjulojn (nome “KVEKordigoj” kaj “STRINGenCIJFERfunctiesExcel”), por kies ebligo ĝi petas vian permeson ĉe malfermo.

Resume, la nepra komponantaro de ESPSOF (Versio 0.95) estu jen:

-----------------------------------------------------------------------------------------------

Microsoft Visual Basic (WORD – Normal):

Modules:
EspKONTR en kiu i.a. la ĉefprogramo TEKSTanal;
EspWSTAT en kiu i.a. la baza programo AFMbazo kaj apliko KVEK;
EspSINTAKS kun sintaksaj proceduroj subordigitaj al TEKSTanal;
Forms:
EnigoTEKSTanal
EnigoKVEK
Dosieroj:
C:\ESPSOF\ESPSOF-VORTAR.xls
C:\ESPSOF\ESPSOF-REGREZ.xls
C:\ESPSOF\ESPSOF-KVEK.xls

------------------------------------------------------------------------------------------------

La unua de la tri EXCEL dosieroj (~ 7 Mbajt) enhavas la vortarojn (BRO, NPIV 2004, kaj la aldona Dict3). La malfermitkodo de ESPSOF povus allogi uzantojn mem aldoni vortojn al tiu vortaro, sed ankoraŭ NE FARU tion en la nuna Versio 0.95, ĉar tio difektos la funkciadon de ESPSOF. En estontaj versioj, ebleco por sendanĝere mem aldoni vortojn kaj terminojn estos kreita.

La du aliaj EXCEL dosieroj estas rezultdosieroj: ESPSOF-REGREZ montras la eligon de la tekstkontrolilo, ESPSOF-KVEK tiun de la konkordancilo.

Reiru supren

 

Startigi la tekstanalizon (version 0.95)

Antaŭ ol startigi la analizon de iu WORD-dokumento, prizorgu ke ĝi jam estas konservita kaj ke ĝia dosiernoma sufikso estu “.doc”.

Ankaŭ certigu, ke supersignaj literoj tra la tuta tekstdosiero estas koditaj laŭ Unikodo, kion ebligas i.a. la softvarpakaĵo ‘EK’ de Jurij Finkel. La tekstanalizilo ne akceptas (do ruĝigas) vortojn kun h- aŭ x-koditaj literoj. Tamen, en la ESPSOF-modjulo EspWSTAT troviĝas la subrutinoj ‘Supersignoj’ kaj ‘SupersignXstrict’, kiujn oni povas alvoki kiel konvertilojn al Unikodo por la tuta teksto, antaŭ ol startigi TEKSTanal.

Startigu la tekstanalizilon (en la WORD-fenestro) per sinsekva alklako de: ‘Tools’ - ‘Macro’ - ‘Macros’ - ‘TEKSTanal’ - ‘Run’. Tio iom komplika sinsekvo tamen nur necesas la unuan fojon dum sesio. Poste, vi povas startigi la tekstanalizilon simple per klavkombino Alt+T.

Tuj poste aperos granda enig-fenestro per kiu oni povas elekti el diversaj eblecoj, inter kiuj la kvar Opcioj rilate la vorttrezoron (ĉefan novaĵon de Versio 0.95). Aliaj eblaj elektoj estas: transsalti kursivajn vortojn aŭ tekstfragmentojn inter certaj krampoj aŭ citiloj, jes aŭ ne akcepti apostrofadon de la artikolo, bluigi ne-envortarajn kunmetaĵojn, aperigi morfemlimojn, ktp.

En tiu enig-fenestro, se sub la butono “Bone” oni elektas la indikitan vojon “AŬTOMATE PRETIGU”, la kontrolado de la tekstfonto sekvas. Post kiam ĝi finas, aperos ankaŭ aŭtomate la Excel-rezultdosiero kun resumo kaj listoj de lingvaj vortoj, eraroj, propraj nomoj, eventuale ankaŭ sintaksaj rilatoj, ktp. Tiu Excel- rezultdosiero havas la saman nomon kiel la WORD fontodosiero, kaj ĝi estas aŭtomate konservita en la dosierujo C:\ESPSOF\REZULTOJ.

Alternative, se vi estas komputilemulo kaj mem aranĝis la pretigon de la bezonataj vortar- kaj rezultdosieroj antaŭe, elektu la vojon “MI MEM PRIZORGIS”. Tiu vojo ebligas vin pozicii la WORD- kaj Excel-fenestrojn sur la ekrano tiel, ke vi povas rigardi kreskantan vortliston aŭ eĉ plenumiĝantan kunmetaĵ-analizon, flanke de la prilaborata fontoteksto. Vi tamen mem respondecas por poste konservi la rezultdosieron sub iu konvena nomo kaj en iu dosierujo.

Ne ŝanĝu la vojon de “AŬTOMATE PRETIGU” en “MI MEM PRIZORGIS” dum la sama sesio. Tio povas kaŭzi iom ĝenajn komplikaĵojn. Ŝanĝi inverse tamen estas senproblema.

Post startigu, la ESPSOF-tekstanalizilo atentigos vin se la fontoteksto jam enhavas FrazKomencMarkojn, kio signifas ke ĝi jam estas prilaborita de ESPSOF antaŭe. Vi tiam decidu: se vi intertempe ne ŝanĝis la fontotekston, respondu ke la programo reuzu la jam ĉeestantajn FrazKomencMarkojn. Respondu tion ankaŭ se vi certas ke vi nur ŝanĝis aŭ anstataŭigis unuopajn vortojn, sen ke la nombro de vortoj en frazo ŝanĝis per tio. Por pli precizaj detaloj, vidu sube en la sekva sekcio.

Reiru supren

 

Post la tekstanalizo (versio 0.95)

Se ĉe la startigo vi uzis la vojon “AŬTOMATE PRETIGU”, la rezultdosiero ESPSOF-REGREZ (la nomo signifas “REGio de REZultoj”) aŭtomate transmetas sian enhavon jene: se via fontoteksto nomiĝas ‘miaeseo.doc’, kopion de la rezult¬dosiero estas aŭtomate konservita sub la nomo ‘miaeseo 1.xls’ en la dosierujo C:\ESPSOF\REZULTOJ. Tio okazas post kiam la programo TEKSTanal mesaĝas “Tuta tekstdosiero nun analizita”. Ekde tiam la dosiero ESPSOF-REGREZ estas vakigita - ĝi nur servis dum la analizo.

Via fontdosiero restas surloke. Kvankam la tekstanalizilo en Versio 0.95 ne korektas en ĝi erarojn (ĝi nur indikas ilin), la fontdosiero estas ŝanĝita: unue per enmetitaj FrazKomencMarkoj, due per la ruĝigo aŭ rozkolorigo de certaj vortoj, trie per aliaj kolorigoj, depende de viaj elektoj ĉe la startigo (literbluigo de ne-envortaraj kunmetaĵoj, grizigo de transsaltitaj vortoj, verdigo de subjektoj, bluigo de objektoj, ktp). Ekde Versio 0.95 krome okazas aŭtomata enmeto de kaŝitaj dividstrekoj ('Optional hyphens') en longaj vortoj.

Antaŭ ol rigardi la ruĝigitajn vortojn kaj korekti ilin, estas konsilinde ke vi mem konservu vian analizitan fonton, ekz. sub la nomo ‘miaeseo reviz.doc’. Se vi nur korektas erarajn vortojn, samtempe forigante la ruĝigon, vi ne devas fari al si zorgojn pri la FrazKomencMarkojn. Eĉ se la vortnombro en la frazo kreskas aŭ malkreskas nur per unu, tio estas relative sendanĝera. Sed alikaze, vi nepre devu adapti la frazlongecindikon (la plej dekstran de la tri ciferoj) en la koncerna FrazKomencMarko, aŭ forviŝi ĉiujn FrazKomencMarkojn en la WORD-dosiero. Tio eblas per Find/Replace, entajpante "^d" por Find, nenion por Replace, kaj alklakante Replace-All (antaŭe forigu ajnan hoketon apud 'Use wildcards').

Se vi jam antaŭvidis, ke vi ankoraŭ multe ŝanĝos en via teksto, respondu jes se la finiĝinta tekstkontrolilo oferas al vi forviŝi ĉiujn FrazKomencMarkojn.

Ne forgesu ke la FrazKomencMarkoj havas ankaŭ daŭran referencilan rolon, utilan ĉe pristudado de vortspecsekvoj kaj sintaksaj rilatoj listigitaj en la laborfolioj “VortSpecEnFrazo” kaj “S-V-O” de la rezultdosiero, aŭ ĉe la konkordancoj faritaj de KVEK. Por normala legado de la fontoteksto, la FrazKomencMarkoj povas aperi ĝenaj, sed feliĉe la uzanto havas ĉiam la eblecon provizore kaŝi ilin [kaj aliajn fields] per alklako de ‘Tools’ - ‘Options’ - ‘View’ - kaj forigo de la hoketo ĉe ‘Field codes’.

Reiru supren

 

Videbleco de morfemlimoj

estas specialaĵo en via fontotekstdosiero. Se vi ne (aŭ ne sufiĉe) elektis morfem-disigon kiam vi startigis la tekstkontrolilon, vi ankoraŭ havas post la tekst-analizo eblecon aperigi morfemlimojn de unuopa tekstvorto. Alklaku ĝin (la tutan tekstvorton) kaj premu la klavkombinon Alt+M. Por aperigi morfemlimojn de ĉiuj vortoj en la teksto, premu Alt+C. Por kaŝi la morfemlimojn tra la tuta teksta premu Alt+K.

Se vorto kun videblaj morfemlimoj estas punktite substrekita, ekz:


tio signifas ke pli ol unu morfemanalizo eblas (ankaŭ etn'ombr'aj kaj viv'ocel'o). Per Alt+V vi povas – por unuopa tekstvorto – alvoki alternativan analizon. Vortoj kun pli ol du diferencaj analizoj estas raraj (ESPSOF stokas maksimume kvar).

Plejofte, la alternativaj kunmetanalizoj estas nur formale korektaj, sed el uzvidpunkto sensenca aŭ almenaŭ ne ĝenerale akceptita. En ESPSOF la kunmetanalizilo ĉiam celas (kun nuna sukcesgrado de pli ol 97%) aperigi la ‘normalan’ aŭ ‘plej uzatan’ morfemstrukturon de vorto kiel ‘defaŭltan’.

Se la supremenciitaj klavkombinoj ‘Alt+M’, ‘Alt+C’, ‘Alt+K’, ‘Alt+V’ ne funkcias, kio eblas en sesio en kiu vi ne uzis TEKSTanal antaŭe, tiam startigu TEKSTanal kaj tuj sekve alklaku la butonon ‘Nuligu’. Tio povas solvi la problemon.

Reiru supren

 

Konkordancoj per KVEK

La konkordancilon KVEK (‘Konatigu Vortojn En Kunteksto’) vi povas uzi post la tekstanalizo de TEKSTanal. Por KVEK necesas unue malfermi la dosieron C:\ESPSOF\ESPSOF-KVEK.xls, en kiu aperos la konkordancoj. Alvoku KVEK (en la WORD-fenestro) per la klavkombino Alt+Q.

Vi povas uzi KVEK ankaŭ tute sendepende de TEKSTanal, ekzemple kun WORD-dosiero kiu estas kontrolita en antaŭa sesio. Tiam, vi unufoje devas startigi KVEK (en la WORD-fenestro) per sinsekva alklako de: ‘Tools’ - ‘Macro’ - ‘Macros’ - ‘KVEK’ - ‘Run’. Se la fontoteksto ne jam aŭ ne plu havas FrazKomencMarkojn, KVEK petos la uzanto startigi la programon ‘AFMbazo’, kio eblas per sinsekva alklako de: ‘Tools’ - ‘Macro’ - ‘Macros’ - ‘AFMbazo’ - ‘Run’.

KVEK estas plej utila ĉe ampleksa tekstdosiero, kaj ĝuste por konkordanco FrazKomencMarkojn estas tre gravaj referenciloj. Notu ke, se nur parto de via dosiero havas FrazKomencMarkojn, apliko de KVEK kaŭzus pritrakton de nur tiu dosierparto. Pro tio KVEK tuj post alvoko indikas la nombro de ĝuste markitaj frazoj en la dosiero, lasante al vi la eblecon nuligi (‘Cancel’) sian alvokon kaj startigi ‘AFMbazo’ por meti FrazKomencMarkojn tra la tuta teksto.

Reiru supren

Konkordanc-specifo

Aperas sur la ekrano KVEK-dialogujo, per kiu vi nun povas specifi la konkordanc-vorton kaj kelkaj detalojn (vidu ĉi sube). Se vi uzas KVEK unuafoje, estas jam enmetita la vorton ‘akrobato’, simple kiel ekzemplo. Same por la dosier-nomo, kies naiva ekzemplo estas ‘MiaLibro’. La dosiernomon (maksimume 8 literojn, do eble mallongigon de la kompleta dosiernomo) elektu vi.

Post metado de viaj specifoj en la dialogujo, fermu ĝin per alklako de la malgranda ferm-piktogramo en la supra-dekstra angulo (aŭ per la klavkombino Alt+F4 ). Tiam la KVEK-makroo startos kaj traserĉos la fontdosieron. Ĝi avertos vin, kiam la rezulto estas transdonitaj al la EXCEL-dosiero ESPSOF-KVEK.

Rigardu la rezulta konkordanco en Folio 2 de ESPSOF-KVEK. Librotenadon de via konkordanc-specifoj vi vidos en Folio 1. Povas okazi ke vi specifis konkordanc-vorton, kiu tute ne aperis en la tekst-fonto. Tiam, Folio 2 montras nenion, sed Folio 1 afirmas vian specifon kaj la ‘nulan’ rezulton.

Notu, ke la makroo KVEK nur legas, sed tute ne ŝanĝas la WORD-dosieron. Pro tio, post la supraj tri paŝoj, vi povas tuj reiri al la WORD-fenestro, denove alvoki KVEK (Alt+Q), kaj ripeti la tri paŝojn. Plua konkordanc-bloko (de alia vorto, aŭ de la sama vorto kun aliaj specif-detaloj) nun estas produktita, kaj aldonita en la sama EXCEL-dosiero (ESPSOF-KVEK), sub la antaŭa konkordanc-bloko. Tiel, vi povas kolekti dekojn da konkordanc-blokoj, klare listigitaj la unu sub la alia.

Unuopa konkordanc-bloko povas esti 1500 Excel-vicojn longa, kaj la Excel-dosiero ESPSOF-KVEK havas kapaciton por ĉ. 30.000 konkordanc-vicoj entute. Kompreneble, la longo de konkordanc-bloko dependas de la longo de la tekst-fonto kaj la frekvenco de la konkordanc-vorto en tiu.
[Eblas pliigi la maksimumon de 1500, per fontkod-modifo (anstataŭigo de la kvar aperoj de ‘1500’) en la makroo KVEK. Ne faru tion senbezone, ĉar povus malrapidigi la makroon, depende de disponebla komputilmemoro.]

Reiru supren

Morfologiaj elekteblecoj

La konkordanc-VORTO povas esti Substantivo, Adjektivo, Verbo, Adverbo, aŭ iu ajn alia vorto: ankaŭ funkcivorto eblas. Se la uzanto specifas ekz. 'vundo' kiel konkordanc-vorto, la konkordanco enhavos nur la aperojn de tiu laŭlitera vortformo.

Tamen, per specifi 'vund-o' (notu la dividstreketon), ankaŭ la formoj 'vundoj', 'vundon', 'vundojn' enestos. Kaj per specifi 'vund-' (kun dividstreketo fine ), ne nur la substantivaj sed ankaŭ la adjektivaj kaj (ad)verbaj formoj kunestas en la konkordanco.
Aparte specifiebla estas la aldono de malpli frekvencaj participaj finaĵkompleksoj kiel ekzemple -intajn, -ato, -onte ( 'vundintajn', 'vundato', ...); entute ekzistas 36 tielaj finaĵkompleksoj.

Se la uzanto elektas la eblecon 'ankaŭ kiel vort-PARTO', ankaŭ ĉiuj pli longaj vortoj entenantaj la PARTON aperos en la konkordanco (Atentu: tiuj povas esti vortoj kun tute alia senco! Ĉi tie temas pri veraj vortpartoj, ne pri morfemoj).
Se samtempe la uzanto elektas vort-PARTON kies specifo estas ekz. 'vund-o', ne nur kunmeto 'vundopritraktado', sed ankaŭ 'vund-pritraktado' kaj 'vundpritraktado' aperos en la konkordanco. Formo kun streketo, kiel 'vund-pritraktado', aperos eĉ se la elekto estis 'VORTO'.
Elekto de la ebleco ‘nur antaŭa parto’ produktos konkordancon de nur antaŭaj vortpartoj, kun jena difino de ‘antaŭa’: de la unua ĝis maksimume la antaŭlasta literpozicio de vorto.

La makroo KVEK estas speciale taŭga por Esperanto. Sed kondiĉe ke oni uzas ne la dividstreketon, ĝi funkcias ankaŭ por aliaj lingvoj, se ties literoj estas en la Unikodo-subaroj 'Basic Latin', 'Latin-1', aŭ 'Latin Extended-A'. Krome, ĝi funkcias por propraj nomoj kaj akronimoj (specifendaj per majuskloj, kiujn KVEK bone distingas). Eĉ konkordanco de entekstaj ciferoj eblas.

Reiru supren

ReOrdigKVEK

La esenco de konkordanco estas la kuntekstoj en kiuj la konkordanc-vorto ĉiufoje aperas. Pro tio la listigo en EXCEL-dosiero estas tre konvena. Ambaŭflanke de la meza kolumno, en kiu aperas la konkordanc-vorto mem, videblas la maldekstraj kaj dekstraj kuntekstoj. Iliaj longeco (proksimuma nombro de vortoj, normale: 10) estas per la KVEK-dialogujo re-specifiebla de la uzanto. La montrita kunteksto tamen ne transiras frazlimojn.

Defaŭlte, KVEK produktos konkordancon ordigita laŭ apero en la tekst-fonto. Tion oni povas vidi en kolumno A (de Folio 2), kie ĉiu konkordanc-linio havas sian fonto-kodon (dosiernomon kun aline- kaj fraz-numero). Tiu referenco ebligas pristudon de pli vasta kunteksto, se la uzanto deziras tion.

Ĉe longa konkordanc-bloko, povas estas pli interesa, re-ordigi la tuton laŭ la sameco de la kuntekstoj. Praktike eblas nur (almenaŭ en la nuna kadro de la KVEK-softvaro, kiu ne enhavas sintaksan aŭ semantikan scion):

- re-ordigo laŭ la komenco de la dekstra kunteksto;
- re-ordigo laŭ la fino de la maldekstra kunteksto.

Tiel, la re-ordigoj estas ĉiam laŭ la plej apuda kunteksto de la konkordanc-vorto. Ties rezulto donas bonan superrigardon de la tipa uzo de vorto en iu teksto. Por uz-detaloj, konsultu la eksplikojn supre en Folio 2 de la EXCEL-dosiero. Notu ke oni ne uzu la ĝeneralan ‘SORT’-komando de Excel, sed la makroon ‘ReOrdigKVEK’. La unuan fojon dum sesio oni alvoku ĝin pere de ‘Tools’ - ‘Macro’, la sekvantajn fojojn simple per Alt+R.

En la speciale por KVEK aranĝitaj re-ordig-procedoj, la dekstraj kuntekstoj komencantaj per Propra Nomo ĉiam venos laste en la ordig-rango. Simile, maldekstraj kuntekstoj finiĝantaj per Propra Nomo venos laste. Tiu aranĝo faciligas ekz. la pristudon de fenomeno kiel funkcivorto tuj antaŭ aŭ post Propra Nomo.
Post re-ordigo laŭ (mal)dekstra kunteksto, vi ĉiam povas re-ordigi ĉion laŭ fonto-kodo (kolumno A). Ankaŭ por tio, ne uzu ĝeneralan Excel ‘SORT’, sed elektu (‘SELECT’) parton de kolumno A kaj alvoku la makroon ‘ReOrdigKVEK’: nur tiu faros la ordigon taŭge.

Por foje renovigi la tutan konkordanc-enhavon de la EXCEL-dosiero ESPSOF-KVEK, konservu ĝin alinome aŭ alien, kaj re-pretigu la originalan dosieron ESPSOF-KVEK per enmeto de la cifero ‘2’ en ĉelo(2,1) de ĝia Folio 2. Vi ne devas viŝi la malnovajn konkordancojn en Folio 2: la makroo faros tion aŭtomate tuj kiam nova konkordanco eniras. Vi rajtas mem viŝi librotenado-datenojn en Folio 1.
Se vi akcidente perdas la dosieron ESPSOF-KVEK, aŭ se ĝi iamaniere difektiĝis, uzu kopion de ĝi. Se la kopio estas alinoma, renomu ĝin ESPSOF-KVEK kaj enmetu la ciferon ‘2’ en ĉelo(2,1) de ĝia Folio 2.

Ĉiuj ESPSOF-makrooj estas zorge testitaj. Tamen, oni ne povas ekskludi iaman misfunkcion. Se makroo evidente iĝas en eterna ciklo, oni povas halti ĝin per la klavkombino ‘Ctrl’-‘Break’, kaj sekve per alklako de la butono ‘End’.

-------------------------------------------------

Reiru supren