هوش مصنوعی – آیا جای مترجم ‌های زبان در گفتار فیلم به سبک سنتی را خواهد گرفت؟

آیا هوش مصنوعی جای مترجم ‌های گفتار فیلم به سبک سنتی را خواهد گرفت؟

هوش مصنوعی – آیا جای مترجم _های زبان در گفتار فیلم به سبک سنتی را خواهد گرفت؟

تقریباً دست‌اندکاران هر صنعتی که فکرش را بکنید امروزه دارند از خودشان می‌پرسند آیندۀ هوش مصنوعی چه در چنته خواهد داشت.

دنیای ترجمه و مترجم زبان هرگز از این قائله مستثنی نبوده است. فناوری همواره با خودش دوگانگی انسان و ماشین آورده است.

فناوری ‌های نوین در خودکارسازی و شبیه‌سازی رفتار انسان از یک دهه بیش تاکنون هولناک‌تر شده است.

با این حال، آخرین پیشرفت‌های فناوری ترجمه مانند اسکایپ هم آنقدر فرازمینی نبوده که گفتار انسان را در زبان ‌های مختلف بطور کامل تشخیص دهد و ترجمه کند.

به همین ترتیب، اگر خدمات زیرنویس خودکار در یوتیوب را امتحان کنید، حتی در زبان ‌های رایج مانند انگلیسی نیز گاهی ایرادهای خنده‌داری مشاهده می‌شود. تبدیل صوت به متن کاربردهای زیادی دارد.

برای مثال، صحبت‌های میان شخصیت‌های یک مجموعه سریال را به متن تبدیل می‌کنند تا فرایند ترجمه زیرنویس به زبان ‌های دیگر آسان‌تر شود.

شناخت از جنس انسان

در این میان، صنعت ترجمه یکی از نخستین اهداف پژوهش‌ و توسعۀ در زمینه هوش مصنوعی به شمار می‌رود. برای نمونه، ترجمه گفتار شخصیت‌های یک فیلم در قالب متنی (transcription) بطور سنتی از طریق مهارت‌های شنیداری و دیداری انسان انجام می‌شود.

در اینجا وظیفه‌ای که یک ماشین به‌راحتی می‌تواند به عهده بگیرد بازشناسی امواج صوتی و تبدیل آن به الفبای زبان مربوط است.

این به فرایند ترجمه گفتار به متن توسط انسان نزدیک است اما هنوز «شناخت انسانی» در ماشین ایجاد نشده است.

البته شرکت‌هایی مانند مایکروسافت در تبلیغ محصولات خود برای تشخیص و ترجمه صدا ادعا می‌کنند که این فناوری همین امروز هم قوی‌تر و مطمئن‌تر از انسان‌ها عمل می‌کند.

با این حساب، آیا باید نگران بود که هوش مصنوعی به‌زودی بر میز و صندلی مترجم ‌های واقعی چنبره خواهد زد؟

به تاریخ معاصر نگاه می‌کنیم؛ نام‌های بزرگتر از این همچون گوگل در محصولات هوش مصنوعی خود وعده‌های رویایی‌تری داده بودند. انتظارها آن طور که باید برآورده نشد.

تقلید یا رقابت

برای آزمایش، گروه مهندسی این شرکت‌ها یک تکه صوت را بطور تصادفی از یک مرکز تولیدکننده فایل‌های چندرسانه‌ای برای تبدیل به متن انتخاب کردند تا انسان را به مبارزه در برابر ماشین دعوت کنند.

دو نفری که بطور دستی و با تکیه بر مهارت‌های سنتی گفتار را به نوشتار تبدیل کردند 11.3 درصد خطا داشتند. در حالی که محصول مایکروسافت با کسب امتیازی بیشتر فقط 5.9% خطا داشت.

مقاله مربوط: ترجمه ماشینی عصبی چیست؟

شاید نتوان نتایج را به تمام جامعه مترج های حرفه‌ای در حوزه ترجمه و زیرنویس فیلم بسط داد، اما ظاهراً ماشین‌های باهوش حرفی برای گفتن دارند.

ما از کیفیت آن فایل صوتی و محتوایش خبر نداریم و کسی انکار نمی‌کند که ماشین هوش مصنوعی در برخی شرایط آرمانی می‌تواند انسان را مثل آب خوردن شکست دهد.

این اتفاق‌ها روزگاری در مورد کاسپارف و ماشین ‌های اولیه شطرنج رخ داد. انسان در شرایط پیچیده‌تر و بازه زمانی طولانی‌تر حریف ندارد.

چالش‌های پیش‌رو
درست مانند هر نوع فناوری موجود در خدمات زبان و ترجمه، موانع فراوانی برای رسیدن ماشین به پای انسان وجود دارد.

هر چه باشد، گوش انسان بطور طبیعی قادرست معنای صداهای گفتار را به‌راحتی از هیاهوی پس‌زمینه تشخیص دهد، اما ماشین هوش مصنوعی از چنین نعمتی برخوردار نیست.

از این گذشته، مسائل حل‌نشده‌ای وجود دارد که هنوز در فناوری تشخیص صوت باقی مانده است:

  • وقتی چندین نفر همزمان در حال صحبت باشند
  • وقتی لازم باشد جنس و هویت صاحب صدا شناسایی شود
  • وقتی سبک گفتار برای ماشین مبهم باشد (جدیت، شوخی، طعنه و غیره)
  • وقتی گوینده ناگهان لهجه‌اش را تغییر دهد
  • وقتی گوینده به زبانی سخن می‌گوید که بطور طبیعی نیاموخته است
  • وقتی گوینده از ترکیب‌های عامیانه و ابداعی استفاده می‌کند

بنابراین تفاوت بسیار زیادی وجود دارد میان تشخیص یا تبدیل صدایی که از یک شخص در اتاقی ساکت ضبط شده و صدای جروبحث اعضای یک شرکت از ملیت‌های گوناگون همراه با آژیر آمبولانس!

ارزش مترجم ‌های گفتار فیلم به شیوه سنتی همین جا ثابت می‌شود، هر چند که قرار نیست هیچ رقابتی به قصد تصاحب جایگاه شغلی با هوش مصنوعی رخ دهد.

گوشت‌واستخوان یا آهن‌پاره

مسئله این… نیست. این روزها اغلب گفتگوهای مربوط به هوش مصنوعی حول محور « فناوری دشمن انسان » می‌چرخد. با این حال، آیندۀ خدمات تبدیل گفتار فیلم به متن تا این اندازه خصمانه نیست.

همچون رباتی که شطرنج بازی می‌کند، ماشین ‌های آهنی قرار نیست به قصد نابودی به حرفۀ انسان‌ها هجوم بیاورند. زیرا ضعف‌ها و قوت‌های خودشان را دارند و این دو جبهه در شرایط خاص می‌توانند مکمل هم باشند.

دقت در تبدیل گفتار فیلم به متن تاحدود زیادی به کیفیت صدا، سبک گفتگو و سایر ظرافت‌های زبانی بشر بستگی دارد.

اما ماشین هرگز از یادگیری خسته نمی‌شود. بی‌وقفه در حال آموختن و گسترش حافظه است و اشتباه‌هایش بتدریج از «گوشت‌واستخوان» کمتر خواهد شد.

حتی با این فرض که هوش مصنوعی ماشین در آینده نزدیک بتواند انسان را در میزان خطاهای شنیداری و نوشتاری شکست دهد. باز هم مقداری نارسایی باقی می‌ماند که نیاز به ویراستاری و تولید نسخه طبیعی داشته باشد.

دعوا ندارند؛ هر دو طرف برنده هستند!

آیا ترجمه ماشینی روزی جایگزین ترجمه انسانی خواهد شد؟


نسخه‌برداری از این مطلب همراه با ذکر منبع مانعی ندارد.