Dan Tufis & al * Corpora and Corpus-Based Morpho-Lexical Processing
| Într-o zi seninã ºi friguroasã de aprilie, pe când ceasurile bãteau ora treisprezece, Winston Smith, cu bãrbia înfundatã în piept pentru a scãpa de vântul care-l lua pe sus, se strecurã iute prin uºile de sticlã .... |
| Fig. 1. - Plain text. |
| Într- | Într- | Spsay | ||
| o | o | Qf Pp3fsa--------w Mcfsrl Tifsr Va--3s
|
o | Tifsr |
| zi | zi | Vmip1s Ncfsrn Vmm-2s | zi | Ncfsrn |
| seninã | seninã | Afpfsrn | seninã | Afpfsrn |
| ºi | ºi | Ccssp Px3--d--------w Rp | ºi | Ccssp |
| friguroasã | friguroasã | Afpfsrn | friguroasã | Afpfsrn |
| de | de | Csssp Spsa | de | Spsa |
| aprilie | aprilie | Ncms-n | aprilie | Ncms-n |
| , | , | , | ||
| pe | pe | Spsa | pe | Spsa |
| când | când | Rw | când | Rw |
| ceasurile | ceasurile | Ncfpry | ceasurile | Ncfpry |
| bãteau | bãteau | Vmii3p | bãteau | Vmii3p |
| ora | ora | Ncfsry | ora | Ncfsry |
| treisprezece | treisprezece | Mc-p-l | treisprezece | Mc-p-l |
| , | , | , | ||
| Winston | Winston | Npms-n | Winston | Npms-n |
| Smith | Smith | Np | Smith | Np |
| , | , | , | ||
| cu | cu | Spsa | cu | Spsa |
| bãrbia | bãrbia | Ncfsry | bãrbia | Ncfsry |
| înfundatã | înfundatã | Vmp--sf Afpfsrn | înfundatã | Afpfsrn |
| în | în | Spsa | în | Spsa |
| piept | piept | Ncms-n | piept | Ncms-n |
| pentru | pentru | Spsa | pentru | Spsa |
| a | a | I Qn Spsa Tsfs Va--3s | a | Qn |
| scãpa | scãpa | Vmnp Vmii3s Vmm-2s | scãpa | Vmnp |
| de | de | Csssp Spsa | de | Spsa |
| vântul | vântul | Ncmsry | vântul | Ncmsry |
| care | care | Pw3--r Vmsp3 Ncfp-n Dw3--r---e | care | Dw3--r---e |
| -l | -l | Pp3msa--y-----w | -l | Pp3msa--y-----w |
| lua | lua | Vmp--sm Vmnp Vmii3s Vmm-2s | lua | Vmii3s |
| pe | pe | Spsa | pe | Spsa |
| sus | sus | Ncms-n Rgp | sus | Rgp |
| , | , | , | ||
| se | se | Px3--a--------w | se | Px3--a--------w |
| strecurã | strecurã | Vmis3s | strecurã | Vmis3s |
| iute | iute | Afpfsrn Afpms-n Rgp Ncfson | iute | Rgp |
| prin | prin | Spsa | prin | Spsa |
| uºile | uºile | Ncfpry | uºile | Ncfpry |
| de | de | Csssp Spsa | de | Spsa |
| sticlã | sticlã | Ncfsrn | sticlã | Ncfsrn |
| ... | ... | ... | ||
| Fig. 2. - Segmented text |
Fig. 3. - Ambiguously annotated text | Fig. 4. - Disambiguated text | ||
40