مذكرة الأربعة

السلام عليكم ورحمة الله وبركاته. اهلا وسهلا الى البلوقي. :)


في هذا الإدخال ، أود أن أشارك حول الكلمات الشائعة، وإحصاء توافق الكلمات. الكلمات الشائعة او الكلمات اللغوية هو Corpus. لفظ الجمع منها corpora أو corpuses. كمية هائلة من النصوص اللغوية، مطبوعة كانت او غير مطبوعة، تمثل إلى حد كبير طرق استخدامات لغة معنية وتكون في معظم الأوقات هذه المعلومات في صورتها الإليكترونية من أجل سهولة تحليلها. تحتوي على ملايين كلمة ويتمم تحليلها باستخدام برنامج واضع العلامات وبرنامج محلل الكلمات حسب سياقها.






ثم, إحصاء توافق الكلمات (Word Concordance). عبارة عن برنامج تحليل corpus في إحصاء الكلمات الذي يسمح: 

1- إحصاء توافق الكلمات في الفقرات أو الجمل أو المقالة.
2- معرفة موقع الكلمات المعينة من النص أو الفقرات.
3- معرفة كيفية استخدام الكلمات المعينة من النص أو الفقرات.
4- بناء المسرد (index)  للكلمات المعينة.





Comments