The earliest algorithms for automat

The earliest algorithms for automatically assigning part-of-speech were based
on a two-stage architecture (Harris, 1962; Klein and Simmons, 1963; Greene
and Rubin, 1971). The first stage used a dictionary to assign each word a list
of potential parts of speech. The second stage used large lists of hand-written
disambiguation rules to winnow down this list to a single part-of-speech for
each word.
ENGTWOL The ENGTWOL tagger (Voutilainen, 1995) is based on the same twostage
architecture, although both the lexicon and the disambiguation rules
are much more sophisticated than the early algorithms. The ENGTWOL
lexicon is based on the two-level morphology described in Chapter 3, and
has about 56,000 entries for English word stems (Heikkila, 1995), counting
a word with multiple parts of speech (e.g. nominal and verbal senses of hit)
as separate entries, and of course not counting inflected and many derived
forms. Each entry is annotated with a set of morphological and syntactic
features. Figure 8.8 shows some selected words, together with a slightly
simplified listing of their features.

0/5000

From: -

To: -

Results (Arabic) 1: [Copy]

Copied!

واستندت الخوارزميات أقرب لتعيين تلقائياً جزءا من الكلامعلى بنية ذات مرحلتين (هاريس، 1962؛ كلاين وسيمونز، 1963؛ غرينوروبين، 1971). المرحلة الأولى استخدام قاموس لتعيين كل كلمة قائمةمن المحتمل أجزاء من الكلام. المرحلة الثانية تستخدم قوائم كبيرة مكتوبة بخط اليدتوضيح قواعد غربلة أسفل هذه القائمة إلى واحدة جزء-من-خطاباكل كلمة.ويستند بلغة "انجتوول انجتوول" (فوتيلينين, 1995) على مرحلتين نفسالهندسة المعمارية، وعلى الرغم من أن كل من المعجم وقواعد للمعاييرهي أكثر تعقيداً بكثير من الخوارزميات بوقت مبكر. انجتوولالمعجم يقوم على مستويين مورفولوجية الموصوفة في الفصل 3، وقد 56,000 عن إدخالات للكلمة الإنكليزية ينبع (هيكيلا، 1995)، عدكلمة مع أجزاء متعددة من الكلام (مثل الحواس الاسمية واللفظي لضرب)لا عد مقوس كإدخالات منفصلة، وبطبيعة الحال، واستمد عدد كبيرأشكال. كل دخول هو مشروح بمجموعة من الخصائص المورفولوجية والنحويةميزات. يبين الشكل 8, 8 بعض الكلمات المختارة، جنبا إلى جنب مع قليلاًقائمة مبسطة بخصائصها.

Being translated, please wait..

Results (Arabic) 2:[Copy]

Copied!

Being translated, please wait..

Results (Arabic) 3:[Copy]

Copied!

أقرب خوارزميات تلقائيا تخصيص جزء من خطاب تقوم
على مرحلتين العمارة (هاريس، 1962؛ Klein، سيمونز، 1963؛ غرين
و روبين، 1971).المرحلة الأولى تستخدم القاموس يعطي كل كلمة قائمة
من المحتمل أن أقسام الكلام.مرحلة ثانية تستخدم قوائم كبيرة بخط اليد
توضيح القواعد التي تهب الريح أسفل هذه القائمة إلى أي جزء من الكلام
كل كلمة.
engtwol engtwol بلغة (voutilainen، 1995) يقوم على نفس twostage
الهندسة المعمارية، بالرغم من أن المعجم و توضيح القواعد
هي أكثر تعقيدا بكثير من أوائل الخوارزميات.engtwol
قاموس يقوم على مستويين الصرف الوارد في الفصل 3،
حوالي 56000 لمداخل الكلمة الانجليزية ينبع (heikkila 1995)، عد
كلمة تحمل عدة أقسام الكلام (مثل اسمي المعاني اللفظية ضرب)
باعتبارها مداخل منفصلة، و بالطبع لا عد مقوس أشكالا كثيرة مشتقة
.كل دخول هو المشروح مع مجموعة من الميزات الصرفية و النحوية
.ويبين الشكل 8-8 بعض الكلمات المختارة، سوية مع a قليلا
تبسيط قائمة السمات.

Being translated, please wait..

Other languages

The translation tool support: Afrikaans, Albanian, Amharic, Arabic, Armenian, Azerbaijani, Basque, Belarusian, Bengali, Bosnian, Bulgarian, Catalan, Cebuano, Chichewa, Chinese, Chinese Traditional, Corsican, Croatian, Czech, Danish, Detect language, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Frisian, Galician, Georgian, German, Greek, Gujarati, Haitian Creole, Hausa, Hawaiian, Hebrew, Hindi, Hmong, Hungarian, Icelandic, Igbo, Indonesian, Irish, Italian, Japanese, Javanese, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Korean, Kurdish (Kurmanji), Kyrgyz, Lao, Latin, Latvian, Lithuanian, Luxembourgish, Macedonian, Malagasy, Malay, Malayalam, Maltese, Maori, Marathi, Mongolian, Myanmar (Burmese), Nepali, Norwegian, Odia (Oriya), Pashto, Persian, Polish, Portuguese, Punjabi, Romanian, Russian, Samoan, Scots Gaelic, Serbian, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenian, Somali, Spanish, Sundanese, Swahili, Swedish, Tajik, Tamil, Tatar, Telugu, Thai, Turkish, Turkmen, Ukrainian, Urdu, Uyghur, Uzbek, Vietnamese, Welsh, Xhosa, Yiddish, Yoruba, Zulu, Language translation.