یکی از کاربردهای اینترنت سهولت در دسترسی به محتوای علمی و سایر رسانه‌ها است و  این توانایی که هرکس ناشر آثار خود باشد نیز یکی از پیامدهای گسترش کاربری اینترنت است که می‌تواند پیامدهای مثبت و منفی بسیاری داشته باشد. یکی از عواقب ناخواسته‌ای که انتشار محتوا در اینترنت در پی خواهد داشت آن است که انبوهی از محتوای متنوع از نظر ویژگی‌های فنی را فراهم می­آورد. حجم محتوای علمی زبان فارسی روزبه‌روز و باسرعت در حال افزایش است و کاربران به دلایل مختلفی علاقه زیادی به اطلاعات فارسی نشان می­دهند. از آنجا­که زبان غالب در اینترنت انگلیسی است جست‌وجو به زبان‌های غیرانگلیسی از جمله فارسی، ملاحظات خود را دارد.

به طور کلی برخی مسائل و مشکلاتی که در خطوط معمول جهان وجود دارد را می‌توان به شیوه زیر طبقه‌بندی کرد:


1.   شکل واحدی از نوشتار، اصوات مختلف را بیان می‌کند مانند حرف "ی" در فارسی که در کلماتی مانند یک، سیب، عیسی اصوات مختلفی دارد یا حرف "و" در کلمات سوار، سود، تو.

2.   اصوات واحد به شکل‌های متفاوتی نوشته می‌شوند. به‌عنوان مثال در فارسی حرف "س" به 3 صورت (س، ص، ث) و حرف "ز" به چهار شکل (ز، ذ، ض، ظ) نوشته می‌شود.

3.   برخی حروف نوشته می‌شود اما خوانده نمی‌شود مثل خواننده یا خواهر.

4.   اصواتی هستند که تلفظ می‌شود اما در نوشته‌ها نشانه‌ای برای آن‌ها استفاده نمی‌شود. در فارسی سه مصوت کوتاه (  َ ِ ُ ) چنین هستند یا الف در کلمه اسحق.

 

منبع: راثی ساربانقلی، محمد صابر. 1384. مهارت در جستجوی اطلاعات فارسی از اینترنت؛ مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران/شماره اول، دور پنجم.