نسل جدید سامانه تبدیل گفتار فارسی به نوشتار با ارائه نسخه بیانات رهبر معظم انقلاب در بازه زمانی 1370 تا 1393 رونمایی شد.
نرمافزار تولیدی شرکت دانشبنیان عصر گویشپرداز، صبح امروز با حضور مسوول نهاد نمایندگی مقام معظم رهبری در دانشگاه صنعتی شریف رونمایی شد.
این سامانه تمامی سخنرانیها، بیانات و کلاسهای درس مقام معظم رهبری را از سال ۷۰ تاکنون به متن تبدیل کرده است.
سامانه تبدیل فایلهای صوتی سخنرانیهای مقام معظم رهبری که با فناوری هوش مصنوعی و اختصاصی کردن موتور تشخیص گفتار طراحی شده این امکان را فراهم کرده که فایلهای صوتی و ویدئویی ضبط شده از بیانات رهبر معظم انقلاب به صورت متن دربیاید.
این نرمافزار نسل دوم تکنولوژی تایپ گفتاری فارسی محسوب میشود که با بهرهگیری از تجارب به کار گرفته شده در فناوری شرکتهایی مانند گوگل، مایکروسافت و آمازون، بومیسازی و پیادهسازی شده است.
سامانه تبدیل فایل صوتی به متن به صورت اختصاصی در فاز نخست برای بیانات مقام معظم رهبری رونمایی شده است و در فازهای بعدی این نرمافزار برای عموم کاربرد خواهد داشت.
دکتر هادی ویسی، مدیرعامل این شرکت دانش بنیان با بیان اینکه نسل اول نرم افزار تبدیل گفتار فارسی به نوشتار، دارای محدودیت هایی بود، افزود: محدودیت اول این که گفتار حتما باید به صورت کتابی می بود و گفتارهای محاورهیی با غلط های زیادی تبدیل به نوشتار می شد، ضمن این که وابستگی زیادی به صدای افراد داشت و باید حتما فرد موردنظر، چند جمله را به صورت آزمایشی برای نرم افزار می خواند تا صدای او برای سیستم نرم افزار، قابل تشخیص باشد و محدودیت سوم به بحث کیفیت صدا برمی گشت که در محیط های پر سر و صدا و همراه با پارازیت صوتی (اختلال صوتی)، دقت آن کاهش می یافت.
به گفته وی در نسل ارتقا یافته نرم افزار تبدیل گفتار فارسی به نوشتار، محدودیت های نسل قبلی تا حدود بسیار زیادی برطرف شده است و قابلیت استفاده در مصاحبه ها، سخنرانی ها و جلسات کاری را دارد.
نرم افزار تبدیل گفتار به متن
ویسی درباره نسخه اختصاصی رونمایی شده که سخنرانیهای مقام معظم رهبری در ۲۳ سال گذشته را به متن تبدیل کرده است، گفت:
برنامه این نرم افزار در دو بخش اختصاصی سازی شده است. بخش اول به کلمات و ادبیات موضوع اختصاص دارد که در این بخش، بیش از سه میلیون کلمه در نرم افزار بارگذاری شده و بخش دوم نیز به مبحث صدا مربوط می شود و درعین حال، ساختار معنایی و انشایی و ادبیات را به نرم افزار اضافه کردیم و به اصطلاح مدل زبانی به نرم افزار دادیم.
وی درباره نحوه کارکرد این نرم افزار نیز توضیح داد: در این سامانه، فایل صوتی به صورت صدا یا ویدئو یا هر فرمت دیجیتال در نرم افزار، بارگذاری می شود و سامانه نیز پس از پردازش فایل، آن را به صورت متن نوشتاری تحویل می دهد.
ویسی تصریح کرد: نسخه جدید سامانه تبدیل گفتار فارسی به نوشتار، همچنین این ویژگی را دارد که در صورت مشکوک بودن به صحت یک کلمه، آن را به صورت رنگی نشان می دهد تا کاربر با دقت بیشتری آن را بررسی کند.
وی درباره سرعت و مدت زمان تبدیل گفتار به نوشتار نیز گفت: سرعت انجام این کار به سرعت پردازنده رایانه کاربران بستگی دارد و به عنوان مثال می توان یک سخنرانی یک ساعته را در مدت 10 یا 30 دقیقه و در صورت پایین تر بودن سرعت اینترنت در مدت یک ساعت به نوشتار تبدیل کرد.
ویسی در ادامه با اشاره به تحلیل انجام شده روی کلمات و متون سخنرانیهای مقام معظم رهبری گفت: براساس این بررسی، رهبر معظم انقلاب در بیانات خود، ۶۰ هزار کلمه و واژه اختصاصی را به کار بردهاند و این در حالی است که یک فرد عادی در طول عمر خود با کمتر از ۱۰هزار کلمه اختصاصی سروکار دارد. در همین حال بررسیهای صورت گرفته از مجموعه متون شکسپیر نیز نشان میدهد که کل کلمات به کار رفته در این مجموعه حدود ۳۰ هزار کلمه بوده است که این امر نشان از حجم وسیع واژگان و غنای سخنان مقام معظم رهبری دارد.
وی ادامه داد: پردازش و تحلیل محتوای کلمات پرکاربرد در فرمایشات مقام معظم رهبری نیز حاکی از آن است که کلماتی مانند اسلامی، ملت، کشور، کار، اسلام، ایران، وجود، انقلاب، دنیا، سال، نظام، انسان، امام، دشمن، حرکت، روز، خدا، جمهوری، الهی و بزرگ ۲۰ کلمه پرکاربرد فرمایشات رهبر معظم انقلاب طی ۲۳ سال اخیر بوده است.