دوشنبه، ۲۶ مرداد ۱۳۸۸ | مجله ادبی  
فهیمه شانه

اشاره: این نوشته، چکیده‌ای است از یک مقالهٔ دانشجویی دربارهٔ رسم‌الخط زبان فارسی در فضای سایبر. اصل مقاله نیز، بخشی از یک پایان‌نامهٔ در حال تدوین است که به ثبت رسیده و به زودی منتشر خواهد شد.

انتشار این چکیده، صرفاً برای شنیدن نظرات برنامه‌نویسان وب، محققان حوزهٔ زبان‌شناسی و تمام کسانی‌ست که دربارهٔ موضوع رسم‌الخط در فضای وب نظراتی دارند. شنیدن و خواندن نظرات این عزیزان، مایهٔ افتخار خواهد بود.

بیش از هزار سال است که رسم‌الخطِ زبانِ فارسی نیازهای نوشتاری این زبان را رفع می‌کند. در سال‌های اخیر، اهلِ فن، معایب و نارسایی‌های بسیاری را برای آن برشمرده‌اند. از جمله نداشتن رسم‌الخط واحد که به ویژه در فضای وب مشکلاتی را به وجود آورده است.

تری‌لی‌اوت (TrayLayout)  از جمله نرم‌افزارهای کاربردی است که برای از میان بردنِ این کاستی‌ها و تلاش برای یک‌دستیِ شیوهٔ نوشتار، طراحی شده است تا از مشکلات کاربرانِ فارسی‌زبانِ وب بکاهد.

۱٫الف) برخی از مشکلات نداشتن رسم‌الخطِ واحد و تأثیر تری‌لی‌اوت:

می‌دانیم که سازندگان نرم‌افزارهای حروف‌چینی و سیستم‌های عاملِ رایانه، با ما نه هم‌زبان‌ اند و نه هم‌میهن. بنابراین بسیاری از مشخصه‌های زبان ما را نمی‌شناسند و از نیازهای وبلاگ‌نویسان و وب‌نویسان ایرانی بی‌خبرند. در نتیجه نرم‌افزارهایی هماهنگ و متناسب با زبان‌های خود می‌سازند. در چنین شرایطی، کاربران فارسی‌زبان به دلیل ناهماهنگیِ نرم‌افزارهای حروف‌چینی با زبان فارسی، در استفاده از این قبیل نرم‌افزارها با مشکلاتی مواجه می‌شوند.

این مشکلات چیست؟

سازندگان سیستم‌های عامل و نرم‌افزارهای حروف‌چینی (عموماً Microsoft) روزبه‌روز به گسترهٔ کاربران و مشتریان خود می‌افزایند و تلاش می‌کنند تا با در نظر گرفتن نیازها و ملاحظات بازارهای مختلف، بر سودآوری خود بیفزایند. اما همان‌طور که گفته شد به دلیل ناآشنایی با زبان و جامعهٔ ایران و زبان فارسی، همواره کاستی‌های بسیاری در محصولات آن‌ها به چشم می‌خورد. از آن جمله:

  1. وجود «ی» عربی به جای «ی» فارسی در برخی از نسخه‌های ویندوز و Word.
  2. وجود «ک» عربی به جای «ک» فارسی در برخی از نسخه‌های ویندوز و Word.
  3. تبدیل «هٔ» به «ة» در فونت‌های استاندارد وب.
  4. ناممکن بودن ایجاد نیم‌فاصله که مانعی در راه اعمال رسم‌الخط واحد است.
  5. جابجایی «پ» و «ژ» در صفحه کلیدهای مختلف.
  6. نقص در علامت‌های « ـَــِــُُ »، تشدید، تنوین، الف همزه‌دار و…
  7. ارائهٔ آمار غلطِ شمارِ کلمات فارسی در متن.

۲٫الف) امکاناتی که به دلیل نداشتن رسم‌الخط واحد، از آن‌ها بهرهٔ درستی نمی‌بریم:

۱٫       نداشتن رسم‌الخط واحد، کاربرانِ فارسی‌زبان را از برخی ابزارهای کاربردیِ وب محروم می‌کند. (از جملهٔ این ابزار، «مترجم صفحات وب»، «مترجم متن» و تا حدودی «فرهنگ لغات آنلاین» است. ما به علت نداشتن رسم‌الخط تعریف شده، در به‌کار گرفتن مترجم صفحات وب با مشکلاتی مواجه خواهیم شد. چون مترجم صفحاتِ وب که از سوی شرکت Google ارائه شده است، با بهره‌گیری از ماشین، کلمات و جملات را ترجمه می‌کند. می‌دانیم که ماشین زمانی قادر به ترجمهٔ متن خواهد بود که کلمات در سیستم‌عاملش تعریف شده باشند. بنابراین به دلیل نداشتن رسم‌الخط واحد، نمی‌توانیم کلمات را به ماشین ارائه کنیم و از آن انتظار ترجمهٔ درست متن را داشته باشیم. چرا؟ تصور کنید در ماشینِ مترجمِ گوگل، واژهٔ «دانشجو» تعریف شده باشد. اگر کاربری، «دانش جو» را به مترجم گوگل بدهد، طبیعتاً ترجمهٔ مطلوبی تحویل نمی‌گیرد.

اخیراً سایت گوگل نرم‌افزار نسخهٔ آلفای ترجمهٔ فارسی را نیز ارائه کرده است که البته کامل نیست و ترجمهٔ درخوری در اختیار کاربران نمی‌گذارد. این به دلیل اشکالات بسیاری است که در آن وجود دارد و باید منتظر تکامل آن باشیم. مسلماً نبود رسم‌الخط واحد یکی از این مشکلات است که در تکمیل این نرم‌افزار تأثیری مهم و تعییین‌کننده دارد. (این موضوع،‌ بحثی مفصل را درپی دارد که از این مجال خارج است.)

۲٫       در نرم‌افزار Word قابلیتی کارا به نام Spelling & Grammar  تعبیه شده است که مشکلات املایی متن را شناسایی و برطرف می‌کند. این ابزار در ۲۰۰۷ Word از زبان‌های: انگلیسی، فرانسوی و اسپانیایی، پشتیبانی می‌کند.

اما کاربرِ فارسی‌زبان از این ابزار به کلی بی‌بهره است. حتی اگر برنامه‌نویسان ما افزونه‌ای برای Word بنویسند که صحت املای فارسی را بیازماید، نبود رسم‌الخط واحد در کار این سامانه مشکلاتی به وجود می‌آورد.

۳٫       نرم‌افزارهای Word نسخه‌های XP و ۲۰۰۰ با تولدشان امکان املای نوشته را در اختیار کاربران انگلیسی‌زبان گذاردند: یعنی کاربر می‌گوید و رایانه تایپ می‌کند! مدتی است که برنامه‌نویسان ایرانی هم نسخهٔ فارسی این افزونه را نوشته‌اند. اما این تلاش چندان مؤثر نخواهد بود. زیرا چنین نرم‌افزارهایی در نوشتارهای زبانی با رسم‌الخط واحد و معیار، کاربری خواهند داشت.

ب) امکانات تری‌لی‌اوت (:حروف فارسی، علائم فارسی، نیم فاصله):

تری‌لی‌اوت امکانات مختلفی در اختیار کاربران رایانه می‌گذارد که هم در حروف‌چینیِ متون و هم در وب‌نویسی کاربردهایی مهم دارند. هفت مورد کاستی در رسم‌الخط که قبلاً ذکرشان رفت و امکاناتی را که تری‌لی‌اوت برای رفع این کاستی‌ها در اختیار کاربران می‌گذارد، بررسی می‌کنیم:

۱و۲) «ی» عربی در متون حروف‌چینی شده با فونت‌های فارسی، بدون نقاط زیر «ی» دیده می‌شود. اما در فونتی مانند Tahoma یا Arial که از جمله فونت‌های استاندارد وب هستند، به شکل واقعی دیده می‌شود:

این مسئله موتورهای جستجو را در یافتن کلید واژه‌هایی که در آن‌ها از «ی» یا «ی» استفاده شده است، دچار مشکل می‌کند. فرض می‌کنیم می‌خواهیم مقاله‌ای با عنوان «خط و زبان فارسی در کشور ایران» را جستجو کنیم. اگر کاربر در جستجو از «ی» و «ک» استفاده کند، می‌نویسد: «خط و زبان فارسی در کشور ایران».

اگر مقاله با «ی» و «ک» فارسی بارگذاری شده باشد، کاربر یا هرگز به آن دست نخواهد یافت یا با صرف وقت بسیار زیاد موفق به یافتن آن خواهد شد. البته این را مدیون جامع‌نگریِ موتورهای جستجو (به ویژه گوگل) هستیم به این دلیل که موتورهایی نظیر گوگل چون می‌دانند ما با مشکل «ی» و «ی» مواجهیم، تقریباً هر دو را در یک ستون قرار می‌دهند، اما فقط آن چیزی را که ما جستجو کرده‌ایم در اولویت کار خود قرار می‌دهند و این خود زاینده مشکل دیگری است.

جامع‌نگری موتورهای جستجو، جستجوهای ما را کلی و بی‌دقت می‌کند. فرض می‌کنیم یک کاربر، نام «حسین فتاحی» را جستجو کرده است و به دنبال مطلب خاصی در سایت خبرگزاری کتاب است. بنابراین از قابلیت موتور جستجو استفاده می‌کند و کلیدواژه را این‌گونه انتخاب می‌کند:

«حسین فتاحی + خبرگزاری کتاب»

طبیعتاً اگر از حروف فارسی استفاده کرده باشد و مطلب در خبرگزاری کتاب با حروف عربی نوشته شده باشد، دست‌یابی به آن بسیار بعید یا دشوار است؛ چون موتور جستجو، «حسین فتاحی» را در اولویت پائینِ بررسی قرار می‌دهد. به علاوه این‌ که اگر جستجو را محدود به صفحات با زبان فارسی نکند، نتایجی از سایت‌های عرب‌زبان هم در فهرست نتایج خواهد بود! همهٔ این‌ها، از دقت کاربر فارسی‌زبان در جستجوی اینترنتی می‌کاهد.

این مسئله در موتورهای جستجوی سایت‌های فارسی‌زبان هم مشکلاتی را بوجود می‌آورد. به طور مثال، اطلاعاتِ سایت خانهٔ کتاب ایران به نشانیِ ketab.ir تماماً با «ی» و «ک» نوشته شده‌اند. بنابراین سامانهٔ جستجوی سایت خانهٔ کتاب، زمانی به ما اطلاعات درست و دقیق می‌دهد که کلیدواژه‌مان را با «ی» و «ک» عربی تایپ کنیم.

اگر همهٔ کاربرانِ فارسی‌زبانِ اینترنت در نوشتن مطالب‌شان از حروفِ فارسی بهره ببرند، جستجوهای آن‌ها کاربردی‌تر خواهد شد.

اما تمام مشکلات ما در جستجوهای اینترنتی به کمک تری‌لی‌اوت رفع نخواهد شد. تری‌لی‌اوت به ما حروف فارسی، علامات فارسی و نیم‌فاصله می‌دهد و به ما کمک می‌کند تا نوشته‌هایی درست‌تر داشته باشیم، اما این نرم‌افزار تنها یک ابزار است و تا زمانی که یک رسم‌الخط مشترک و واحد برای نوشتن نداشته باشیم، با مشکل جستجوی بی‌دقت و محروم شدن از امکانات و ابزار دیگر وب رو‌به‌رو خواهیم بود.

۳) در اینترنت چند قلم (فونت) استاندارد وجود دارد که اغلب زبان‌ها -از جمله فارسی و عربی- را پشتیبانی می‌کنند. Tahoma، Arial و چند مورد دیگر از این جمله‌اند. حالا فرض می‌کنیم کاربر به جای «ه‌ی» از «هٔ» استفاده می‌کند. معمولاً «هٔ» را از کلید ترکیبیshift+i  می‌گیریم. این مورد با قلم‌های فارسی درست از آب در می‌آید اما در قلم‌های استاندارد وب چطور؟ ظاهراً اَعراب در قرابت به تکنولوژی از ما جلوترند و برای همین با shift+i ، کاربر «ة» خواهد داشت نه «هٔ». تری‌لی‌اوت این مشکل را حل کرده است و هم «ة» را در اختیار کاربر خواهد گذاشت و هم با shift+r  «هٔ» را به کاربر باز می‌گرداند.

۴) نیم‌فاصله در کم‌تر زبانی معنا دارد. در فارسی وقتی تصمیم می‌گیریم «می» و «گیریم» را جدا بنویسیم یا در کلمهٔ «بچه‌ها»، باید از نیم فاصله استفاده کنیم. حالا space را امتحان می‌کنیم:

«بچه ها»

«می گیریم»

این ظاهر اصلاً دوست‌داشتنی نیست و در پاراگراف‌بندی هم ما را به چاله می‌اندازد. کتاب‌های دهه‌های گذشته را به خاطر بیاورید؛ هر جا که سطر تمام می‌شد و «می» از «گیریم» جا می‌ماند، مشکل را با یک «-» رفع می‌کردند و با این شیوه به مخاطب می‌فهماندند که این «می» و آن «گیریم» با هم فامیل‌ اند!

اما این بازی‌ها در وب مجالی ندارند. مخاطب وب برای خواندن فرصت زیادی ندارد و طبیعی است که بخواهد روان و ساده بخواند. نیم‌فاصله این امکان را در اختیار ما قرار می‌دهد تا این دو خویشاوند را در کنار هم و زیر یک سقف و سایه بنشانیم تا نه حوصلهٔ مخاطب سر برود نه «-» از آسمان بیاید و جای خود را میان یک کلمهٔ واحد در زبان فارسی بازکند. این‌ها مختصری از فواید نیم فاصله است.

۵) در بسیاری از صفحه کلیدها با مشکل جابجایی «پ» و «ژ» مواجه‌ایم. گاهی «÷» جای «پ» را گرفته و گاهی هرسه با هم جابجا شده‌اند. تری‌لی‌اوت این مشکل را هم برطرف می‌کند. ضمن آن‌ که به ما امکان تنظیمِ دستیِ صفحه کلید را می‌دهد تا حروف را به دلخواه جابجا کنیم.

۶) تری‌لی‌اوت، بسیاری از علامات را نیز در صفحه کلید در اختیار کاربران قرار می‌دهد: «ـَــِــُــًـــٍـْــٌــّـٰــٔـ» و « أ – إ – ء – ٱ». این یعنی تایپ آسان فارسی و نیز تایپ آسان عربی!

۷) در نرم افزار ۲۰۰۷ Word در قسمتی از نوار پایین صفحه، شمارِ کلمات در یک سطر نشان داده می‌شود. به کمک تری‌لی‌اوت، عدد درستی از شمارش کلماتی که علامت جمع دارند، کلمات مرکب، افعال پیشوندی و… را مشاهده خواهیم کرد. در غیر این صورت کلماتی که هویت کلمهٔ مستقل ندارند نیز در شمار کلمات در یک سطر خواهند آمد.

مثال:

■ بچه‌ ها: بدون استفاده از نیم‌فاصله دو کلمه حساب می‌شود.

■ بچه‌ها: با استفاده از نیم‌فاصله یک کلمه حساب می‌شود.

نیم فاصله و کلمات غیرِبسیط:

یکی از کاستی‌های رسم‌الخطِ زبان فارسی، پیوستگی زیادِ حروف در یک کلمه است. به ویژه در محیط‌های نوشتاری رایانه‌ای، ماشین نمی‌تواند به قطعیت تصمیم بگیرد که کدام عبارت یک کلمهٔ مرکب است و کدام عبارت دو یا چند کلمهٔ مجزا. جدانویسی یا سرهم‌نویسی از جمله مسائلی است که در تدوین رسم‌الخط همیشه مطرح بوده است و هر کس، بنا به سلیقه و برداشت خود از سهولت و آسان‌خوانی، یکی از آن دو شیوه را به همراه استثناهای فراوان برمی‌گزیند. طرفداران این دو شیوه، برای کار خود توجیه و مبنای علمی ندارند. (نشر دانش؛ دشواری‌های پردازش رایانه‌ایِ خط فارسی، دکتر محرم اسلامی؛ سال نوزدهم؛ شمارهٔ سوم، پاییز۸۱).

کلمات مشتق، مرکب و مشتق‌-مرکب در زبان فارسی را گاه باید با اتصال‌های زیاد نوشت. اگر مبنا را بر جدانویسی بگذاریم، در این‌گونه کلمات می‌شود هر واحد کلمه را در واحد واژگانی مستقل خودش با یک نیم‌فاصله به کلمهٔ قبلی یا بعدی متصل کرد. با این کار به دو هدف دست یافته‌ایم: ۱: واحدهای سازندهٔ کلمه بدون این ‌که مستقل از ترکیب دانسته شوند، از یکدیگر بازشناخته می‌شوند. ۲: مانع اتصال در رسم‌الخط و در نتیجه خوانش دشوار کلمهٔ مرکب که احتمالاً ساختار نوشتاری طولانی نیز دارد، از میان خواهد رفت. با این شیوه در کلمات غیربسیط، ریشه‌ها، پایه‌ها، وندها و سایر اجزای کلمه آشکارتر خواهند شد. (جز وندهایی مثل ی و ه)

اگر دربارهٔ موضوعِ این یادداشت نظری دارید، منت می‌گذارید اگر از طریق ستون سمت راست (فرم پیک) آن را برای‌مان بفرستید.

 

 

Share/Bookmark
تازه‌های نشر
القاعده از زبان مشاور سابقش!
مصطفی حامد –مشهور به ابوالولید المصری- از جمله مشاوران و نزدیکانِ سابقِ گروهِ «القاعده» در خاطراتش این گروهِ تروریستی را به مخاطبان شناسانده است.
اسناد مطبوعاتی‌های مجلس رفته در کتابی تازه
این کتاب بر اساس اسناد گواهی می‌دهد که بیش از هزار نفر از اهالی قلم به مجلس رفته‌اند. از این تعداد 240 نفر مدیرمسؤول و سردبیر بوده‌اند.
پیراهن تو پرچم کدام جمهوری است
پیراهن تو پرچمِ کدام جمهوری است نخستین دفترِ شعرِ رسول پیره است که انتشاراتِ دفترِ شعرِ جوان در سال 1390 آن را منتشر کرده است.
رویدادهای فرهنگی
همراه امام با مردم سخن می‌گوید | برگزار شد
صادق طباطبایی همراهِ امام خمینی، سخنگویِ دولتِ مهندس بازرگان، خواهرزادهٔ امام موسی صدر و از اقوامِ مدیرِ شهرِ کتاب است.
رونمایی از تصویر قدیمی‌ترین قرآن در مجلس
این دست‌نوشتهٔ نفیس مربوط به سال 484 هـ.ق است. نامِ عثمان بن حسین وراق غزنوی به عنوان کاتب و تذهیب‌کارِ این قرآن برده شده است
گفتگو درباره تازه‌ترین اثر بلخاری در شهر کتاب
کتاب "فلسفه هنر اسلامی" نوشته دکتر حسن بلخاری سه‌شنبه 27 دی‌ماه در شهر کتاب بررسی می‌شود.
بازنشر نوشته‌های اشا، با هر حجم و به هر نحو، بدون اجازه و اطلاعِ اهالی خانه، مایه‌ کدورت است!