loading...

tehranvacuum

بازدید : 350
سه شنبه 20 خرداد 1399 زمان : 13:05

در جستجوی الهام بخشیدن به بهبود مترجمان متنی مبتنی بر رایانه ، محققان دانشکده دارتموت برای راهنمایی به کتاب مقدس مراجعه کردند. نتیجه ، الگوریتمی است که بر روی نسخه های مختلف متون مقدس آموزش دیده است که می تواند آثار مکتوب را به سبک های مختلف برای مخاطبان مختلف تبدیل کند.


ابزارهای اینترنتی برای ترجمه متن بین زبانهایی مانند انگلیسی و اسپانیایی به طور گسترده در دسترس است. ایجاد مترجمان به سبک - ابزارهایی که متن را به همان زبان نگه می دارند اما سبک را تغییر می دهند - ظهور کندتر است. تا حدودی ، تلاش برای توسعه مترجمان به دلیل دشواری در دستیابی به حجم عظیم داده های موردنیاز ، متوقف شده است. اینجاست که تیم تحقیق به کتاب مقدس روی آوردند.

تیم هدایت دارتموت علاوه بر اینکه منبع هدایت معنوی بسیاری از مردم جهان است ، در کتاب مقدس "یک مجموعه بزرگ ، قبلاً بدون استفاده از متن موازی هم تراز شده" را دیدند. گذشته از ارائه الهام بی نهایت ، هر نسخه از کتاب مقدس حاوی بیش از 31000 آیه است که محققان برای تولید بیش از 1.5 میلیون جفت منحصر به فرد از منبع و هدف برای مجموعه های آموزش ماشین آموزی استفاده می کنند.

طبق تحقیقات منتشر شده در ژورنال Royal Society Open Science ، این اولین مجموعه داده موازی نیست که برای ترجمه سبک طراحی شده است. اما این اولین کسی است که از کتاب مقدس استفاده می کند. متون دیگر که در گذشته مورد استفاده قرار گرفته اند ، از ورودی های شکسپیر گرفته تا ورودی های ویکی پدیا ، مجموعه داده هایی را ارائه می دهند که یا بسیار کوچکتر یا غیر هستند و همچنین برای کار ترجمه سبک یادگیری مناسب هستند.

کیت کارلسون ، دکتری دکتری گفت: "کتاب مقدس انگلیسی زبان در سبک های نوشتاری بسیار متنوعی وجود دارد که آن را تبدیل به متن منبع کاملی برای ترجمه با سبک می کند." دانشجو در دارتموث و نویسنده اصلی مقاله تحقیق در مورد این مطالعه.

به عنوان یک مزیت اضافه برای تیم تحقیق ، کتاب مقدس در حال حاضر کاملاً با استفاده مداوم از اعداد کتاب ، فصل و آیه فهرست بندی شده است. سازماندهی قابل پیش بینی متن در نسخه ها ، خطر خطاهای تراز را که می تواند با روش های خودکار تطبیق نسخه های مختلف همان متن ایجاد شود ، از بین می برد.

دانیل راک مورمور ، استاد علوم کامپیوتر در دارتموث و نویسنده مشارکت در این مطالعه گفت: "کتاب مقدس داده های" الهی "است که برای مطالعه این کار با آنها کار می کند." "انسان ها قرن ها وظیفه ساماندهی متون کتاب مقدس را بر عهده داشتند ، بنابراین ما نیازی به ایمان خود را در الگوریتم های تراز کم اعتماد تر قرار ندادیم."

برای تعریف "سبک" برای مطالعه ، محققان طول جمله ، استفاده از صداهای منفعل یا فعال و انتخاب کلمه را که می تواند در متنهایی با درجات مختلف سادگی یا صوری بودن نتیجه بگیرد ، ارجاع می دهند. طبق این مطالعه: "متن های مختلف ممکن است سطح ادب و یا آشنایی متفاوتی با خواننده داشته باشد ، اطلاعات فرهنگی مختلفی را درباره نویسنده به نمایش بگذارد ، درک آن برای برخی از جمعیت آسان تر باشد."

این تیم از 34 نسخه متمایز کتاب مقدس استفاده کرده است که در پیچیدگی زبانی از "نسخه پادشاه جیمز" گرفته تا "کتاب مقدس به زبان انگلیسی پایه" است. متن ها به دو الگوریتم تغذیه می شدند - یک سیستم ترجمه ماشین آماری به نام "موسی" و یک چارچوب شبکه عصبی که معمولاً در ترجمه ماشین "Seq2Seq" استفاده می شود.

در حالی که نسخه های مختلف کتاب مقدس برای آموزش کد رایانه مورد استفاده قرار می گرفت ، در نهایت می توان سیستمهایی تولید کرد که سبک هر متن نوشتاری را برای مخاطبان مختلف ترجمه کند. به عنوان مثال ، یک مترجم سبک می تواند یک انتخاب انگلیسی زبان را از "Moby Dick" انتخاب کند و آن را به نسخه های مختلف مناسب برای خوانندگان جوان ، افراد انگلیسی غیر بومی یا هر یک از انواع مخاطبان ترجمه کند.

کارلسون گفت: "ساده سازی متن فقط یک نوع خاص از انتقال سبک است. به طور گسترده تر ، سیستم های ما با هدف تولید متن با همان معنی اصلی ، اما این کار را با کلمات مختلف انجام می دهند."

کالج دارتموث دارای سابقه طولانی در زمینه نوآوری در علم کامپیوتر است. اصطلاح "هوش مصنوعی" در یک کنفرانس سال 1956 که ایجاد یک رشته تحقیقاتی هوش مصنوعی در دارتموث اختراع شد. پیشرفت های دیگر شامل طراحی BASIC - اولین زبان برنامه نویسی عمومی و در دسترس - و سیستم زمان بندی مشترک Dartmouth است که به سیستم عامل مدرن امروزی کمک کرده است.


http://bookmark-template.com/story6994851/پمپ-وکیوم-آبی

در جستجوی الهام بخشیدن به بهبود مترجمان متنی مبتنی بر رایانه ، محققان دانشکده دارتموت برای راهنمایی به کتاب مقدس مراجعه کردند. نتیجه ، الگوریتمی است که بر روی نسخه های مختلف متون مقدس آموزش دیده است که می تواند آثار مکتوب را به سبک های مختلف برای مخاطبان مختلف تبدیل کند.


ابزارهای اینترنتی برای ترجمه متن بین زبانهایی مانند انگلیسی و اسپانیایی به طور گسترده در دسترس است. ایجاد مترجمان به سبک - ابزارهایی که متن را به همان زبان نگه می دارند اما سبک را تغییر می دهند - ظهور کندتر است. تا حدودی ، تلاش برای توسعه مترجمان به دلیل دشواری در دستیابی به حجم عظیم داده های موردنیاز ، متوقف شده است. اینجاست که تیم تحقیق به کتاب مقدس روی آوردند.

تیم هدایت دارتموت علاوه بر اینکه منبع هدایت معنوی بسیاری از مردم جهان است ، در کتاب مقدس "یک مجموعه بزرگ ، قبلاً بدون استفاده از متن موازی هم تراز شده" را دیدند. گذشته از ارائه الهام بی نهایت ، هر نسخه از کتاب مقدس حاوی بیش از 31000 آیه است که محققان برای تولید بیش از 1.5 میلیون جفت منحصر به فرد از منبع و هدف برای مجموعه های آموزش ماشین آموزی استفاده می کنند.

طبق تحقیقات منتشر شده در ژورنال Royal Society Open Science ، این اولین مجموعه داده موازی نیست که برای ترجمه سبک طراحی شده است. اما این اولین کسی است که از کتاب مقدس استفاده می کند. متون دیگر که در گذشته مورد استفاده قرار گرفته اند ، از ورودی های شکسپیر گرفته تا ورودی های ویکی پدیا ، مجموعه داده هایی را ارائه می دهند که یا بسیار کوچکتر یا غیر هستند و همچنین برای کار ترجمه سبک یادگیری مناسب هستند.

کیت کارلسون ، دکتری دکتری گفت: "کتاب مقدس انگلیسی زبان در سبک های نوشتاری بسیار متنوعی وجود دارد که آن را تبدیل به متن منبع کاملی برای ترجمه با سبک می کند." دانشجو در دارتموث و نویسنده اصلی مقاله تحقیق در مورد این مطالعه.

به عنوان یک مزیت اضافه برای تیم تحقیق ، کتاب مقدس در حال حاضر کاملاً با استفاده مداوم از اعداد کتاب ، فصل و آیه فهرست بندی شده است. سازماندهی قابل پیش بینی متن در نسخه ها ، خطر خطاهای تراز را که می تواند با روش های خودکار تطبیق نسخه های مختلف همان متن ایجاد شود ، از بین می برد.

دانیل راک مورمور ، استاد علوم کامپیوتر در دارتموث و نویسنده مشارکت در این مطالعه گفت: "کتاب مقدس داده های" الهی "است که برای مطالعه این کار با آنها کار می کند." "انسان ها قرن ها وظیفه ساماندهی متون کتاب مقدس را بر عهده داشتند ، بنابراین ما نیازی به ایمان خود را در الگوریتم های تراز کم اعتماد تر قرار ندادیم."

برای تعریف "سبک" برای مطالعه ، محققان طول جمله ، استفاده از صداهای منفعل یا فعال و انتخاب کلمه را که می تواند در متنهایی با درجات مختلف سادگی یا صوری بودن نتیجه بگیرد ، ارجاع می دهند. طبق این مطالعه: "متن های مختلف ممکن است سطح ادب و یا آشنایی متفاوتی با خواننده داشته باشد ، اطلاعات فرهنگی مختلفی را درباره نویسنده به نمایش بگذارد ، درک آن برای برخی از جمعیت آسان تر باشد."

این تیم از 34 نسخه متمایز کتاب مقدس استفاده کرده است که در پیچیدگی زبانی از "نسخه پادشاه جیمز" گرفته تا "کتاب مقدس به زبان انگلیسی پایه" است. متن ها به دو الگوریتم تغذیه می شدند - یک سیستم ترجمه ماشین آماری به نام "موسی" و یک چارچوب شبکه عصبی که معمولاً در ترجمه ماشین "Seq2Seq" استفاده می شود.

در حالی که نسخه های مختلف کتاب مقدس برای آموزش کد رایانه مورد استفاده قرار می گرفت ، در نهایت می توان سیستمهایی تولید کرد که سبک هر متن نوشتاری را برای مخاطبان مختلف ترجمه کند. به عنوان مثال ، یک مترجم سبک می تواند یک انتخاب انگلیسی زبان را از "Moby Dick" انتخاب کند و آن را به نسخه های مختلف مناسب برای خوانندگان جوان ، افراد انگلیسی غیر بومی یا هر یک از انواع مخاطبان ترجمه کند.

کارلسون گفت: "ساده سازی متن فقط یک نوع خاص از انتقال سبک است. به طور گسترده تر ، سیستم های ما با هدف تولید متن با همان معنی اصلی ، اما این کار را با کلمات مختلف انجام می دهند."

کالج دارتموث دارای سابقه طولانی در زمینه نوآوری در علم کامپیوتر است. اصطلاح "هوش مصنوعی" در یک کنفرانس سال 1956 که ایجاد یک رشته تحقیقاتی هوش مصنوعی در دارتموث اختراع شد. پیشرفت های دیگر شامل طراحی BASIC - اولین زبان برنامه نویسی عمومی و در دسترس - و سیستم زمان بندی مشترک Dartmouth است که به سیستم عامل مدرن امروزی کمک کرده است.


http://bookmark-template.com/story6994851/پمپ-وکیوم-آبی

نظرات این مطلب

تعداد صفحات : 0

درباره ما
موضوعات
آمار سایت
  • کل مطالب : 14
  • کل نظرات : 0
  • افراد آنلاین : 1
  • تعداد اعضا : 0
  • بازدید امروز : 3
  • بازدید کننده امروز : 1
  • باردید دیروز : 1
  • بازدید کننده دیروز : 0
  • گوگل امروز : 0
  • گوگل دیروز : 0
  • بازدید هفته : 6
  • بازدید ماه : 24
  • بازدید سال : 107
  • بازدید کلی : 6097
  • <
    پیوندهای روزانه
    آرشیو
    اطلاعات کاربری
    نام کاربری :
    رمز عبور :
  • فراموشی رمز عبور؟
  • خبر نامه


    معرفی وبلاگ به یک دوست


    ایمیل شما :

    ایمیل دوست شما :



    کدهای اختصاصی