لە زمانناسی، کۆپەس (بە ئینگلیزی: Corpus) یان کۆپەسێکی نووسراو سەرچاوەیەکی زمانە کە پێکهاتووە لە کۆمەڵێکی گەورە و پێکهاتوو لە نووسراوەکان (ئەمڕۆ بە شێوەیەکی ئەلیکترۆنی هەڵدەگیرێت و پرۆسەی لەسەر دەکرێت). لە زمانی کۆپەس، بەکاردێن بۆ ئەنجامدانی شیکاریی ئاماری و تاقیکردنەوەی گریمانەیی، پشکنینی ڕووداوی یان پشتڕاستکردنەوەی یاساکانی زمان لە ناو ناوچەیەکی زمانێکی دیاریکراو.

لە تەکنەلۆژیای گەڕان، کۆپەس کۆکراوەی بەڵگەنامەکانە کە بەدوایدا دەگەڕێن.

ڕوانگەی گشتی

دەستکاری

کۆپەسێک لەوانەیە وتارەکان لە یەک زماندا (کۆرپەسێکی یەک زمان) یان داتای وتارەکان بە چەندین زمان (کۆرپۆسی فرە زمان) لەخۆبگرێت.

بۆ ئەوەی کۆڕەکان زیاتر بەسوود بن بۆ ئەنجامدانی توێژینەوەی زمانەوانی، زۆرجار ڕووبەڕووی پرۆسەیەک دەبنەوە کە بە تێبینی ناسراوە. نموونەیەک لە تێبینیکردنی کۆپەس بریتیە لە تێبینی بەشێک لە قسەکردن، بە ئینگلیزی POS-ێک، کە تێیدا زانیاری دەربارەی بەشێک لە وشەیەک لە قسەکردن (وشە، ناو، پێناسە، هتد) زیاد دەکرێت بۆ کۆپەسەکە لە شێوەی تاگ (لەزگە). نموونەیەکی تر بریتیە لە ئاماژەدان بە شێوەی lemma لیمما (بنچینەیی) بۆ هەر وشەیەک. کاتێک زمانەکە زمانێکی کارکردنی ئەو توێژەرانە نییە کە بەکاری دەهێنن، گڵۆسی نێوان هێڵەکان بەکاردێت بۆ ئەوەی تێبینیەکە دوو زمان بێت.

هەندێک لە کۆرپەسەکان ئاستێکی زیاتر لە شیکاری پێکهاتەیییان هەیە کە جێبەجێ کراون. بە تایبەتی، جەستەی بچووکتر لەوانەیە بەتەواوەتی شیبکرێتەوە. ئەم جۆرە کۆپەسانە بەگشتی بە درەخت یان کۆپەسی شیتەڵکراو ناودەبرێن. زەحمەتبوونی دڵنیابوون لەوەی کە تەواوی کۆپەسەکە بەتەواوەتی و بە بەردەوامی تێبینی کراوە مانای ئەوەیە کە ئەم کۆپەسانە بەگشتی بچووکترن، کە نزیکەی یەک بۆ سێ ملیۆن وشەی تێدایە. ئاستەکانی تر لە شیکاریی پێکهاتەی زمانەوانی ئەکرێ هەبن، لەوانە نیشانەکردن بە مەبەستی مۆرفۆلۆجیا، سێمانتیک و پراکتیکی.

جێبەجێکردنەکان

دەستکاری

کۆپەسەکان بنکەی سەرەکین بۆ زمانەوانی کۆرپەس. بوارە دیارەکانی تری جێبەجێکردن بریتین لە:

  • تەکنۆلۆژیای زمان، پرۆسەی زمانە سروشتیەکان، زمانناسی ژمێریاری
    • شیکاری و پرۆسەی جۆراوجۆرەکانی کۆڕپەس ھەروەھا بابەتێکی زۆر کاری ھەیە لە زمانی ژمێریاری، ناسینەوەی قسەکردن و وەرگێڕانی ئامێر، کە زۆرجار بەکاردێن بۆ دروستکردنی مۆدێلی شاراوەی مارکۆڤ بۆ بەشێک لە نیشانەی قسەکردن و مەبەستەکانی تر. کۆپەس و لیستی شەپۆلی وەرگیراو بۆ فێرکردنی زمان بەسوودە. کۆپەس دەتوانرێت وەک جۆرێک لە یارمەتیی نووسینەوەی زمانی بیانی تەماشا بکرێت وەک ئەو زانیارییە ڕەسەنانەی کە لەلایەن بەکارهێنەرانی زمانە نا ڕەسەنەکانەوە بەدەست دێت لەڕێگەی دەرکەوتن بۆ نووسراوە ڕاستەقینەکان لە کۆرپەسدا ڕێگە بە فێرخوازان دەدات بۆ تێگەیشتن لە شێوازی پێکهاتنی ڕستەکان لە زمانی ئامانجەکە، کە ڕێگە بە نووسینێکی کاریگەر دەدات.[١]
  • وەرگێڕانی ئامێر
    • کۆڕپەسە فرەزمانەکان کە بە شێوەیەکی تایبەت فۆرمات کراون بۆ بەراوردکردنی تەنیشت بە تەنیشت پێیان دەوترێت کۆڕۆبەسە تەریب ڕێکخراوەکان. دوو جۆری سەرەکی کۆرپەسی هاوتەریب هەن کە دەقیان لە دوو زمان تێدایە. لە کۆپۆسێکی وەرگێڕاندا، دەقەکان لە زمانێکدا وەرگێڕانی دەقەکانن لە زمانێکی تر. لە کۆپەسێکی هاوشێوەدا، دەقەکان لە هەمان جۆرن و هەمان ناوەڕۆکیان تێدایە، بەڵام وەرگێڕانی یەکتر نین.[٢] بۆ بەکارھێنانی وتارێکی هاوتەریب، جۆرێک لە ڕێکخستنی وتار کە بەشە یەکسانەکانی وتار دیاری دەکات (دەستەواژە یان ڕستەکان) مەرجێکی پێشوەختە بۆ شیکاری. ئەلگۆریتمەکانی وەرگێڕانی ئامێر بۆ وەرگێڕان لەنێوان دوو زماندا زۆرجار ڕاهێنراون بە بەکارهێنانی پارچە هاوتەریبەکان کە پێکهاتوون لە کۆپەسێکی زمانی یەکەم و کۆپەسێکی زمانی دووەم، کە وەرگێڕانی یەکە-بۆ-یەکە لە کۆرپەسێکی زمانی یەکەم.
  • فیلۆلۆجی
    • هەروەها نوسینەکان بەکاردێن لە لێکۆڵینەوە لە بەڵگەنامە مێژووییەکان، بۆ نموونە لە هەوڵەکان بۆ لێکدانەوەی نووسراوە کۆنەکان، یان لە ڕەخەگرتنی کتێبە پیرۆزەکاندا. هەندێک لە کۆڕپەسە شوێنەوارییەکان لەوانەیە ئەوەندە کورت بن کە لە کاتی خۆیدا وێنەیەک پێشکەش بکەن. یەکێک لە کورتترین کۆڕپەسەکان لەوانەیە نووسراوەکانی نامەکانی ئەمارنا بێت کە ساڵی ١٥٣٠ بوو (١٣٥٠ پێش زایین). کۆپەسێکی شارێکی دێرین، (بۆ نمونە "Kültepe Texts"ی تورکی) ، لەوانەیە لەڕێگەی زنجیرەیەک کۆپەسەوە بەرهێمهێنرابێت، کە بەوە دەناسرێت کاتی دۆزینەوەی شوێنەوارەکانی تێدایە.

سەرچاوەکان

دەستکاری
  1. ^ Yoon, H., & Hirvela, A. (2004). ESL Student Attitudes toward Corpus Use in L2 Writing. Journal of Second Language Writing, 13(4), 257–283. Retrieved 21 March 2012.
  2. ^ Wołk، K. (7 April 2014). «A Sentence Meaning Based Alignment Method for Parallel Text Corpora Preparation». Advances in Intelligent Systems and Computing. 275. Springer: 107–114. arXiv:1509.09090. doi:10.1007/978-3-319-05951-8_11. ISBN 978-3-319-05950-1. ISSN 2194-5357. {{cite journal}}: نرخەکانی ڕێکەوت بپشکنە لە: |date= (یارمەتی)