خواستگاری و نامزدی
اندوه و نشاط همواره دوشادوش هم سفر کنند و در آن هنگام که
یکی بر سفره ی شما نشسته است ، دیگری در رختخوابتان آرمیده
باشد.شما پیوسته چون ترازویید بی تکلیف در میانه اندوه و
نشاط .
جبران خلیل جبران
شنبه 7/6/1388 - 6:20
دانستنی های علمی
شهر التمحیص (ماه پاك شدن)
امام زین العابدین (ع) در دعای استقبال و ورود به ماه رمضان در صحیفه سجادیه این ماه را شهر التمحیص نامیده اند. راغب اصفهانی می نویسد: محص به معنای تخلیص و رهایی شئ از عیب است. تمحیص به معنای تزكیه و تطهیر است. ماه رمضان ماه تصفیه بر نفس و پاك كردن و برطرف نمودن عیوب و دور كردن خود از گناهان است. ماه صاف كردن قلب و دل از پلیدی هاست. ماه شستن عداوتها و كینه ها و عقده ها و حسد ها و سایر رذایل اخلاقی است. ماه تخلیص خویشتن از شر گناهان و نجات یافتن و حركت در مسیر فلاح و رستگاری و سعادت است. ماه پاكسازی قلب و روح و ماه خود سازی است.
باز امام سجاد (ع) در دعای وداع با ماه رمضان می فرمایند: درود بر تو ای همسایه ای كه دلها (بر اثر عبادت و بندگی) در آن نرم و فروتن گردید و گناهان (بر اثر آمرزش و عفو خدای متعال) در آن كم شد.
درود بر تو! چه بسیار گناهان را محو كردی و چه بسیار عیبها و زشتی ها را پوشاندی
جمعه 6/6/1388 - 5:47
شعر و قطعات ادبی
گام دگر مانده است گام دگر گام دگر ، هر جا كه هستی باز هم گامی دگر مانده است غم در دلم بیداد كرد ، اما نگرییدم آن همگام ، هم هرگز نمی گریید می گریاند احساس كردم قلبم از چوب است از چوب ، خونین چون صلیب آنگاه بر آن تو مصلوبی تو ای همراه ای فرزانه ای مولا در خویش می گفتم گامی دگر مانده است مقصد رسیدن نیست رفتن رهیدن نیست رفتن به هر بیراهه رفتن ، هرز گردیدن چون چرخ چرخیدن نفس تحرك خواهش كور زمان ماست گام نهایی در نهان ماست بعد از رسیدن ها گامی دگر باقی ست |
جمعه 6/6/1388 - 5:46
شعر و قطعات ادبی
معجزه
بر چفت مقبره پیر
قفلی میان گره ها و قفل ها
دیشب گشوده شد
هیهات ... بدبختی چه كس آغاز گشته است ؟
نصرت رحمانی
جمعه 6/6/1388 - 5:41
دانستنی های علمی
این شمایید که زحمت رفتن به اقیانوسی که متعلق به شماست را باید بکشید و آیا می خواهید با ظرفی ، از آن اقیانوس که دربگیرنده همه خواسته های تان می باشد بردارید یا همه آن را ؟رها کردن مانند دری است بین آرامش و درماندگی ، بین موفقیت و ناکامی ، بین ثروت و فقر ، بین شادی و اندوه ، پس منتظر چه هستید ؟ رها کنید آن چه را در ذهن شما حک شده و ذهن و روح تان را مختل کرده است ، در را باز کنید تا سرازیر شود به سمت شما آنچه که منتظرش هستید. مهدی آریافر
پنج شنبه 5/6/1388 - 5:44
خواستگاری و نامزدی
زندگی زیباست ، زندگی آتشگهی دیرینه پابرجاست ، گر بیفروزیش رقص شعله اش تا هر کران پیدلست ورنه خاموش است و خاموشی گناه ماست سیاوش کسرایی
پنج شنبه 5/6/1388 - 5:41
دعا و زیارت
خطبهاى از حضرت علی ( ع )
در این خطبه ، سخن از آغاز آفرینش آسمان و زمین و آفرینش آدم ( ع ) است .
حمد باد خداوندى را كه سخنوران در ثنایش فرو مانند و شمارندگان از شمارش نعمتهایش عاجز آیند و كوشندگان هر چه كوشند ، حق نعمتش را آنسان كه شایسته اوست ، ادا كردن نتوانند . خداوندى ، كه اندیشههاى دور پرواز او را درك نكنند و زیركان تیزهوش ، به عمق جلال و جبروت او نرسند . خداوندى كه فراخناى صفاتش را نه حدّى است و نه نهایتى و وصف جلال و جمال او را سخنى درخور نتوان یافت ، كه در زمان نگنجد و مدت نپذیرد . آفریدگان را به قدرت خویش بیافرید و بادهاى باران زاى را بپراكند تا بشارت باران رحمت او دهند و به صخرههاى كوهساران ، زمینش را از لرزش بازداشت .
اساس دین ، شناخت خداوند است و كمال شناخت او ، تصدیق به وجود اوست و كمال تصدیق به وجود او ، یكتا و یگانه دانستن اوست و كمال اعتقاد به یكتایى و یگانگى او ، پرستش اوست . دور از هر شایبه و آمیزهاى و ، پرستش او زمانى از هر شایبه و آمیزهاى پاك باشد كه از ذات او ، نفى هر صفت شود زیرا هر صفتى گواه بر این است كه غیر از موصوف خود است و هر موصوفى ، گواه بر این است كه غیر از صفت خود است .
چهارشنبه 4/6/1388 - 6:23
کامپیوتر و اینترنت
جاوا JAVA یک زبان برنامه نویسی است که درسال 1994 توسط یکی از مهندسین شرکت سان (sun) به نام جیمز گوسلینگ نوشته شد، جیمز از نوشتن برنامه با ++C خسته شده بود و جاوا را برای رفع نیازهای خود طراحی کرد. مثل لینوکس ترودلز که لینوکس (Linux) را برای استفاده خود پدید آورد.
جیمز ابتدا نام این برنامه را oak گذاشت. در آنزمان شرکت sun از توسعه oak منصرف شد ولی با پیشرفت و گسترش اینترنت و مشخص شدن قابلیت های برنامه و تطابق بعضی ویژگی های آن با نیازهای اینترنت شرکت sun پروژه oak را فعال نمود و نام جاوا را برای آن برگزید.
نام جاوا از Jsut Another Vague Acronym گرفته شده است و دلیل آن این بود که تیم برنامه نویسان جاوا به قهوه خیلی علاقه داشتند. این موضوع در لوگوی جاوا هم مشهود است!!
نگارش نسخه اول جاوا در سال 95 آغاز شد و در سال 97 نسخه 1/1 و در سال 98 نسخه 1/2 به بازار ارایه شد. البته تا کنون نسخه های متفاوت با قابلیت های متفاوت به بازار ارایه شده است. جاوا زبان مادر برای سیستم عامل سولاریس است، مثل بیسیک برای سیستم عامل ویندوز و زبان سی برای یونیکس.
مهم ترین ویژگی جاوا این است که اساسا شی گراست به این معنی که توانایی استفاده مجدد و مکرر از کدهای از پیش نوشته شده را دارد.
ویژگی دیگر جاوا این است که بر روی سیستم های مختلف کار می کند مثلا برنامه ای که شما با یک سیستم اینتل نوشته اید به راحتی روی یک سیستم مکینتاش و یونیکس اجرا می شود و این عامل اصلی موفقیت جاوا است.
سادگی، قابل انتقال بودن، کارایی بالا، استحکام، پویایی و ایمنی بالا از دیگر قابلیت های جاوا است.
معمول ترین برنامه هایی که با جاوا نوشته می شود Applet ها هستند. Applet برنامه ای پویا است که در یک صفحه وب اجرا می شود و برای دیدن آن به مرورگری نیاز است که جاوا را پشتیبانی کند. علاوه بر این شما می توانید با جاوا برنامه های کاربردی، چند منظوره وسطح بالا بنویسید مثل نرم افزارهای سرویس دهی شبکه یا سرویس دهنده پست الکترونیک.
جاوا در واقع یک زبان برنامه نویسی شی گرا وبسیار قدرتمند است و تمام خصوصیت های ++C و C را داراست. البته خصوصیت های مشکل ساز آن مثل وراثت و اشاره گرها را کنار گذاشته است. برنامه نویسانی که با C++ آشنا هستند خیلی راحت و سریع می توانند JAVA را یاد بگیرند. با جاوا کد نویسی بسیار آسان تر است و کدها و کلاس ها و کتابخانه های آماده جاوا باعث می گردد نوشتن یک برنامه با جاوا از نظر تعداد خطوط و زمان لازم تقریبا یک سوم یک برنامه ++C است.
.NET رقیب JAVA؟
.NET فرمی است که به وسیله مایکروسافت MicroSoft برای ساخت سایت ها با قابلیت های زیاد و متفاوت ایجاد شده است به طوری که قسمتی از یک پروژه را می توان با ++CV و بخش دیگر را با برنامه ای دیگر نوشت و در نهایت کل آن توسط یک واسطه به نام MSIL ترجمه شده و در محیط .NET قابل اجرا است.
J2EE (نسخه جدید JAVA) به وسیله شرکت SUN و با همکاری شرکت های IBM و HP تهیه شده است. در این قالب تنها زبانی که مورد استفاده قرار می گیرد جاوا است، و بر خلاف .NET که فقط روی محیط های سازگار با ویندوز عمل می کند، مستقل از سخت افزار است.
بین .NET و JAVA کدام را انتخاب کنیمًـ؟
- قابلیت انتقال برنامه ها روی سیستم های مختلف و شعار اصلی جاوا یعنی: "یک بار بنویس و هر جا استفاده کن" (Writeonce-Run anywhere) موضوعی بسیار حایض اهمیت است که بسته به نیاز شما و نوع برنامه شما می تواند خیلی مهم باشد.
- در محیط هایی که چند نوع سیستم سخت افزاری وجود دارد قطعا برنامه های تحت جاوا مناسب تر است ولی اگر در محیط مورد نظر شما از سیستم عامل ویندوز استفاده می شود استفاده از .NET هزینه کمتری در برخواهد داشت.
- .NET ویژگی هایی دارد که با آن می توان سایت های جذاب و زیباتری ساخت اما در سایت های پیچیده و بزرگ و جایی که کارایی مهمتر از ظاهر است بهتر است از جاوا استفاده کنیم.
- تصور کنید نیاز به برنامه ای دارید که در آن چیزهایی به صورت دینامیک ایجاد می شوند و پس از طی یک سری عملیات بر روی آنها از بین می روند، در این نوع برنامه ها تعقیب اشیایی که در برنامه ساخته می شوند، تخصیص و مدیریت حافظه تماما بر عهده برنامه نویس است. اما جاوا دارای یک سیستم خودکار مدیریت و پاکسازی حافظه است که بسیاری از مشکلات را آسان کرده است.
هر تکنولوژی که ایجاد می شود؛ هر برنامه ای که مورد توجه عموم قرار می گیرد قطعا مورد توجه نفوذگران هم واقع می شود، هر سیستمی که بخواهد بماند و پیشرفت کند نیاز به ایمنی دارد و اینجاست که سدهای حفاظتی جاوا و مدل های امنیتی آن که حاصل تلاش زبردست ترین برنامه نویسان دنیاست مورد توجه قرار می گیرد. مدل چهار لایه امنیتی جاوا جلوی خیلی از اقدامات خرابکارانه و نفوذی را می گیرد، ولی هیچ سدی 100درصد غیر قابل نفوذ نیست!!
در هر حال انتخاب بین این دو نیاز به بررسی دقیق، آینده نگری و مشخص شدن اهداف دراز مدت و میزان سرمایه گذاری شما دارد زیرا هزینه هایی که یک برنامه جاوا دربر دارد در اکثر موارد چندین برابر یک برنامه .NET خواهد بود.
جاوا اسکریپت JAVA Script:
کسانی که با دنیای اینترنت و کامپیوتر آشنایی دارند حتما این اسم را شنیدهاند. اما اشتباه نکنید JAVA Script با جاوا فرق دارد. JAVA Script یک برنامه کاملا مستقل است که توسط شرکت SUN و شرکت NetScape ساخته شده است. جاوا هم به صورت فایل اجرایی (exe) و هم در صفحات وب قابل استفاده است. ولی JAVA Script فقط به منظور استفاده در اینترنت طراحی شده است. شما می توانید یک متن جاوا اسکریپت را در ساده ترین ویرایشگرها مثل «وردپد» word pad ویرایش کنید. دستورات JAVA Script درون تگ های HTML قرار گرفته و بعد درون فایلی با پسوند .htm ذخیره می شوند و در مرورگرهای وب قابل مشاهده هستند.
خلاصه این که جاوا برنامه ای قوی و کاربردی است و ابتدا فقط مورد توجه برنامه نویسان آمریکایی بود ولی اکنون به قدری رشد کرده است که برنامه نویسان سراسر دنیا به آن اعتقاد پیدا کرده اند، اما از آنجا که جاوا ابزاری است برای برنامه های پیچیده و بزرگ که توسط تعداد معدودی از سیستم ها مورد استفاده قرار می گیرد، کمتر مورد توجه برنامه نویسان سیستم های کوچک قرار گرفته ولی با همه اینها ابزارهای بسیار قدرتمند و پیشرفته ای دارد که قابلیت های فراوانی به این زبان برنامه نویسی داده است.
سان به بازاری گسترده می اندیشد
جاوا 2 ؛ آخرین تلاش برای بقا
13 سال قبل, 13 نفر از کارمندان سان میکروسیستم برای انجام پروژه پر تشویشی با عنوان “موج جدید پردازش کامپوتری“ پرداختند.
این مشکل از گذشته وجود داشت اما تنها دستاورد این تیم, جوابگویی به این سوال بود که چگونه نیازهای نوین پردازش اطلاعات برطرف می شود. 5 سال طول کشید وافکار ونظرات و پیشنهادات فراوانی مطرح شد تا فناوری جاوا به جهانیان شناسانده شود. جاوا اولین فضایی است که امکان برنامه نویسی قدرتمند تجاری را ایجاد کرد.
جاوا به صورت یک فناوری نوپا وارد بازار شد و بعدها در اینترنت ریشه گرفت. این روزها نام HotJava کمتر به گوش می خورد. این محصول اولین مرورگری بود که Applet ها را پشتیبانی می کرد. Applet ها برنامه های کوچکی بودند که در بروزر ذخیره می شدند و قادر بودند صفحات HTML ثابت را به کاربردهایی جالب همچون بازی های شطرنج دوسویه, چت روم های چند نفری و حتی کاربردهایی در تجارت سهام تبدیل کنند.
توانایی های بالقوه جاوا با نیازهای روز اینترنت همخوانی پیدا کرد و به سرعت به صورت زبان بالفعل اینترنت و محاسبات تجاری درآمد. جاوا به سرعت گسترش یافت و طریقه محاسبات و همچنین استفاده از اینترنت را تغییر داد, به طوری که وقتی شما به صورت آنلاین کتابی می خرید یا سهامی را به فروش می رسانید در حال استفاده از جاوا هستید.
حال پس از گذشت 8 سال فعالیت جاوا,این سوال مطرح می شود که جاوا چگونه می تواند بر موج جدید محاسبات پردازش تاثیر گذار باشدًـ؟
دیدگاه های مختلفی دراین زمینه وجود دارد ولی مهم ترین آنها این است که جاوا اگر می خواهد نقش خود, یعنی افزایش کاربرد کامپیوتر را حفظ کند باید از پیچیدگی خود بکاهد. یکی از کلیدهای موفقیت جاوا نسخه تجاری جاوا 2 است که با نام J2EE شناخته شده است.
J2EE بسیار قدرتمند است و توانایی های زیادی دارد ولی همانطور که می دانیم با افزایش قدرت پیچیدگی ها نیز افزایش می یابد. اما جاوا برای این که با سازگاری بیشتری در هنگام اجرا کار کند و قدرت خود را نیز حفظ کند باید ساده تر باشد.
“جاوا“ 2 یا به این مساله توجه خواهد داشت و نقش خود را درمحاسبات حفظ خواهد کرد و یا به دلیل کاربردی نبودن به دست فراموشی سپرده می شود. اما امیدواری بسیاری وجود دارد که جاوا 2 موفق عمل کند, چون سرمایه ها و افکار زیادی آن را پشتیبانی می کنند. اما برای نیل به این هدف باید قادر به حل دو مساله باشد.
جاوا 2 هنوز هم به طوری باور نکردنی پیچیده مانده است طوری که تنها برای افراد ماهر و نیروهای متخصص قابل استفاده است.
با توجه به یک نیاز جهانی برای کاهش قیمت ها و شرح حال به روز و جدید سازندگان فناوری اطلاعات پیچیدگی می تواند عاملی نابود کننده باشد. جاوا 2 باید با حفظ استانداردهای خود و توجه به نیازهای مشتریان و در صدر قرار گرفتن درعرصه های رقابتی روند تجاری شدن خود را تسریع کند.
همان طورکه ساده تر کردن Visual Basic کاربرد ویندوز را افزایش داد, جاوا 2 نیز باید میانه رو باشد و با کاهش پیچیدگی از حالت اختصاص یافتن به نخبگان خارج شود.
کاهش پیچیدگی جاوا2, آن را در سطح وسیعی قابل فهم و کاربردی می کند ضمن آن که در وقت کاربران هم صرفه جویی می شود وباعث استفاده بهینه از توانایی های آن می شود. علاوه بر آن در زمینه تجاری نیز به مقدار قابل توجهی در هزینه و وقت صرفه جویی می شود.
دومین مساله میزان سرعتی است که نوآوری جاوا 2 در اختیار مشتریان خود می گذارد. میزان سادگی جاوا2 شاید چندان اهمیت نداشته باشد اما در مقابل برای اینکه جاوا2 در عرصه بازار هم حضور یابد باید سرعت خود را به حد ایده آل و مناسب برساند.
افرادی هستند که شاید به کیفیت اهمیت چندانی ندهند ولی به سرعت آنها نیاز باشد بنابر این در اینجا سرعت مهمترین مساله خواهد بود.
جاوا2 هنوز هم می تواند پیشتاز باشد ولی باید در دستورالعمل های خود تغییراتی را ایجاد کند. متخصصان حرفه ای جاوا (JCP) در میدان رقبا در صدر قرار دارند و برای جذب مشتری بیشتر فناوری های خود را قبل از ورود به بازار استاندارد می کنند.
این تغییرات یکی دوسال به طول خواهد انجامید و در حال حاضر با رشد نیازهای مشتریان, فروشندگان ناچاربه عرضه فناوری هایی هستند که صورت تجاری داشته باشد اما در حقیقت این فناوری ها باید قبل از عرضه, موارد مربوط به استاندارد در آنها اعمال شود. درحال حاضرweb فناوری هایی را عرضه می کند که در سطح وسیعی مورد استفاده قرار می گیرد و توسط world wide web consortium استاندارد می شود یعنی این فناوری ها اول در بازار عرضه می شود و بعد عمل استاندارد سازی بر آنها اعمال می شود.
JAVA2 با استانداردی که مورد نیاز مشتری است و با سرعتی بالاتر از انواع قبلی عرضه می شود به طوری که اگر این فناوری نبود باید مرتب مراحل نوآوری, اجرا, استاندارد مورد توجه قرار می گرفت.
جاوا 2 از انواع موفق فناوری های عرضه شده در طول این هشت سال است و ما همچنان به سرمایه گذاری در کاهش پیچیدگی و سرعت نوآوری و استانداردسازی آن ادامه خواهیم داد تا در هشت سال آینده نیز به شکلی موفق عمل کنیم.
نوشته : سید هادی جمشیدیان
منبع: پایگاه تخصصی نرم افزار
چهارشنبه 4/6/1388 - 6:18
کامپیوتر و اینترنت
فرض كنید كه ما متنی را روی كاغذ داریم و میخواهیم آن را وارد رایانه كنیم. اولین روشی كه به ذهن میرسد این است كه متن را به تایپیست بدهیم تا با كامپیوتر تایپ كند. اما آیا میشود عین همان متن را وارد رایانه بكنیم تا نیازی به تایپ نباشد؟
البته دستگاه «اسكنر» میتواند تصویری از آن متن را وارد رایانه كند، تا اینجا بخشی از مشكل ما حل شده است. اما رایانه كه نه عقلی دارد و نه «زبان» میفهمد، نمیتواند حروف و كلمات را از هم تشخیص دهد.
مثلاً اگر از كامپیوتر بخواهیم به ما بگوید كه در متن اسكنشده كلمة «علی» چند بار آمده است، بیآنكه شرمنده شود، میگوید نمیتوانم تشخیص بدهم! در واقع این «تصویر دیجیتالشده» باید به «تصویر قابل پردازش» تبدیل شود. موضوع اصلی OCR همین است.
OCR سرنام اصطلاحی است كه صورت كامل آن در واژهنامههای انگلیسی به دو صورت آمده است:
1. Optical Character Recognition
2. Optical Character Reader
انواع OCR
در زبانهای دیگر، به ویژه زبانهایی كه با حروف لاتینی نوشته میشوند، سالهاست كه از OCR استفاده میشود. اما در ایران تازه دو سه سالی است كه به فكر استفاده از OCR در زبان فارسی افتادهایم.
و اما OCR چند نوع است: یا تایپی است یا دستنویس. یعنی یا باید یك متن قبلاً تایپ شده را (مثل كتابها و روزنامههای چندین سال قبل، یا حتی متنی را كه فایل تایپی آن موجود نیست و فقط پرینت آن را داریم) وارد رایانه كنیم، یا متن دستنویس را.
متنهای دستنویس هم به دو صورت «گسسته» و «پیوسته» وجود دارند: متن «دستنویس پیوسته» مثل همان چیزهایی است كه ما هرازگاهی كه دلمان تنگ میشود روی كاغذ مینویسیم، یا یك نامه، یا یك قطعه شعر و ... اما متن «دستنویس گسسته» همان نوشتههایی است كه حروف آن جدا از هم و به صورت گسسته نوشته شدهاند، مثل نام و نامخانوادگی كه در فرمهای آزمون ثبتنام، به صورت هر حرف داخل یك كادر، نوشته میشوند.
طراحی OCR گسستة فارسی تقریباً در مراحل پایانی كار قرار دارد ولی، OCR پیوسته ظاهراً سالهای زیادی كار میبرد.
فارسی ما و مشكلات آن
قبل از اینكه به مراحل دیگر OCR بپردازیم، لازم است اندكی هم به مشكلات خط فارسی ــ یا در واقع ویژگیهای این خط ــ بپردازیم. اول اینكه ما در فارسی حروف را به صورت چسبیده و پیوسته مینویسیم و این كار برای تشخیص حرف به حرف نوشته از سوی رایانه (كه قرار است در مراحل بعدی آن را تایپ كند) بسیار مشكل است. تصور كنید كه همین كلمه ساده «است» را به حالتهای مختلف میشود نوشت: یكی برای «س» دندانه میگذارد، یكی نمیگذارد، یكی آن را میكشد و یكی نمیكشد و... حالا اگر همین صورتهای مختلف «س» به «ت» هم بچسبند، تشخیص حروف برای ما انسانها هم سخت میشود، چه رسد به رایانه.
شباهت حروف
مشكل دیگر خط ما این است كه حرفهای فارسی بسیار به هم شبیهاند. مثلاً در نظر بگیرید كه تفاوت «ر» با «ز» با «ذ» یا «ب» با «ت» تنها در یك نقطه است، و چون نقطه جزء بسیار كوچكی است، اگر یك خط یا حتی یك لك كوچك روی كاغذ بیفتد، تشخیص حروف از هم بسیار دشوار میشود و دردسر جدی برای بازشناسی حروف توسط رایانه ایجاد میكند. اینها تازه مشكلات خط فارسی است. دربارة اعداد فارسی هم این مشكل وجود دارد: صفر ما یك نقطه كوچك است كه میتواند رایانه را به اشتباه بیندازد؛ اعداد 4، 3، 2، 1 هم بسیار به هم شبیه هستند و تنها تفاوتشان یك دندانه كوچك است.
به دلایل گفته شده OCR درمرحلة كنونی در كشور ما مربوط به «دستنویسهای گسسته» یا متنهای تایپی پیوسته است، و تا بازشناسی متنهای دستنویس پیوسته توسط كامپیوتر راه زیادی در پیش است، چون در دستنویسهای گسسته، اگرچه حروف به هم شباهت دارند، حداقل جداجدا نوشته شدهاند. در متنهای پیوسته تایپی هم مشكل كشیده شدن یك حرف یا شكسته نوشته شدن حروف را نداریم.
البته به گفته مسئولان شركت «پایا» در حال حاضر هم نرمافزارهایی وجود دارد كه متن دستنویس پیوسته را تبدیل به حروف جدا ازهم و گسسته میكنند، ولی ضریب خطای این نرمافزارها زیاد است و به شكل صنعتی درنیامدهاند.
بازشناسی حروف و الگو
تا اینجا گفتیم تصویر صفحهای كه در آن حروف به طور جداجدا (هر حرف داخل یك كادر) نوشته شده است، به وسیلة اسكن وارد رایانه میشود. مرحلة بعدی این است كه حروف بازشناسی شوند، یعنی مكان آنها از دیگر خطوط (مثل خطوط كادری كه داخل آن نوشته شده) بازشناسی شود، و اگر متن پیوسته تایپی است، حروف جدا شوند و زواید تصویر حذف شود. مثلاً اگر دانشآموزی «س» را به گونهای نوشت كه بیرون از كادر بود، به رایانه بفهمانیم كه بیدقتی شده است او باید همان حرف داخل كادر را بخواند.
در مرحلة بعدی كه «بازشناسی الگو» نام دارد، با تعدادی شرط میشود فهمید كه مثلاً حرفی «الف» است یا نه، و رایانه تشخیص میدهد كه حرف «پ» است یا «ب». برای این تشخیص لازم است كه تصویر حرف «الف» با الفهای نمونه ــ كه قبلاً به رایانه داده شده است ــ منطبق شود. الفبای نمونه قبلاً از روی یك مجموعه بزرگ آموزشی تهیه شده و ویژگیهای مشترك از آن استخراج شده است. اما از آنجا كه تنوع صورتها نوشتاری یك حرف به صورت دستنویس بسیار زیاد است، مدلی آماری استخراج میشود كه در آن شباهت ویژگیهای استخراج شدة قبلی با نمونه ورودی به رایانه بررسی میشود. در اینجا «بازشناسی الگو» با روشهای آماری انجام میشود كه روش معمول در سیستمهای OCR است.
اگر فكر میكنید كه كار تمام شده است در اشتباهید، چون تازه میرسیم به دنبالة حروف. مثلاً اگر كسی همان حرف «س» را با دنباله بنویسد، رایانه باید تشخیص دهد كه این حرف فقط «س» است، یا مثلاً «ی» هم به آن چسبیده است.
مدلسازی یا پردازش زبانی
مرحله بعدی «مدلسازی زبانی» یا «پردازش زبانی» نام دارد. حروف به هم چسبیده، كه كلمه را درست میكنند، باید معنیدار یا شناختهشده باشند. در این مرحله بررسی میشود كه چه كلماتی در زبان وجود دارد؟ چه تركیبهایی از كلمات مجاز است؟ و... البته در مراحل پیشرفتهتر، مدلسازی گرامری (دستور زبان) و مدلسازی معنایی هم وجود دارد كه تشخیص میدهد جمله از لحاظ دستوری و معنایی درست است یا بیمفهوم است. اما در OCR گسسته ــ كه بیشتر برای ثبتنام استفاده شده ــ شباهت یك كلمه به نام، نام خانوادگی، شهر و ... كافی است.
برای تشخیص تركیبهای مجاز یك كلمه یا معنیدار بودن یك كلمه نیز به تهیة بانكهای اطلاعاتی (Data base) نیاز داریم. در این بانكها مثلاً تمام نامهای كوچك و بزرگ ایرانیان قبلاً جمعآوری شده است و هنگام تطبیق یك كلمه با آن مشخص میشود كه رایانه حروف آن را دست تشخیص داده یا نه. بنابراین نقش این بانك اطلاعاتی بسیار مهم است، چون اگر نامی در آن ثبت نشده باشد، كلمهای كه آن نام را شامل شود، به طور خودكار از برنامه OCR حذف میشود یا پیغام میآید كه: «این كلمه اشتباه است» در صورتی كه ممكن است مثلاً نام «هشام» در بین نامهای ایرانی وجود داشته باشد، ولی قبلاً در بانك اطلاعاتی ثبت نشده باشد.
بانكهای ما و دیگران
مهندس «رزازی» دربارة مشكل بانكهای اطلاعاتی در زبان فارسی میگوید: «در دنیا برای توسعة OCR و ارزیابی آن، بانكهای اطلاعاتی استاندارد ساخته شده است كه در آنها همة كلمات وجود دارند، یعنی بانك هم مشكل دیجیتال كلمه را دارد، و هم تصویرش را. اما برای زبان فارسی، این بانكهای اطلاعاتی چه برای ارزیابی و چه برای توسعه، استاندارد شده نیست. در واقع هر كسی برای خودش یك بانك اطلاعاتی میسازد، و این نمونههای متفاوت مشكلاتی را ایجاد میكند. مثلاً برای ثبتنام دانشآموزانی كه در آزمون مدارس تیزهوشان شركت كرده بودند، یك بانك اطلاعاتی حاوی نامهای فارسی، از روی اطلاعات فرمهای سالهای قبل، تهیه شد كه از روی آن كلماتی كه خیلی شبیه به نامهای فارسی بودند تشخیص داده میشد. مثلاً اگر رایانه كلمهای را «مصیبت» تشخیص داد، براساس بانك اطلاعاتی معلوم میشود كه «مصیب» بوده است كه یك نام ایرانی است.
علی، ولی، قلی ... و سیب
نكتة دیگر این است كه یك بانك اطلاعاتی باید شامل تعدادی كلمات خام باشد، بلكه «بسامد» آن واژگان، یعنی میزان استعمال و تكرار كلمات در زبان و مشخصات آماری آنها هم باید ثبت شده باشد، والا كارایی زیادی ندارد. مثلاً «علی» نامی است كه شباهت زیادی به «ولی» و «قلی» دارد. كارهای آماری در بانك اطلاعاتی باید طوری انجام شده باشد كه تعداد «علی» بیشتر باشد، تا و بعد نوبت «ولی» و «قلی» برسد، چون درصد بسامدی «علی» به لحاظ آماری و كاربرد در میان نامهای بیشتر است.
در OCR فارسی گسسته، اگر فقط مربوط به نامها و نامخانوادگی باشد، كار سادهتر است از حالتی كه در OCR پیوسته وجود دارد. چون در OCR پیوسته هر كلمهای ممكن است وجود داشته باشد مثل «سیب»، اما در بانك اطلاعاتی نامها همه میدانیم كه سیب نام یك شخص نیست بلكه نام یك میوه است! بنابراین در OCR همواره سعی میشود كه درصد خطا كاهش یابد، تا كلمات در حد ممكن درست تشخیص داده شوند. اگرچه طراحان هنوز به صددرصد صحت نرسیدهاند، ولی نگران نتایج آزمون خود نباشید، چون تمامی اطلاعات مربوط به شما چندین بار كنترل میشوند و از سازوكار reject (یا مردودی) در رایانه هم استفاده میشود. در این روش اگر رایانه نتوانست كلمهای را تشخیص دهد، میفهمد كه نفهمیده است و در خروجیاش میآورد كه: «من این كلمه را نفهمیدهام» و كار به سیستم دستی میرود و در آنجا تصحیح میشود. این فرایند در پست خیلی كارایی دارد. در هر جای دنیا كه تفكیك نامهها و دیگر مرسولات پستی به وسیلة OCR انجام میشود، بعضی از نامهها در سیستم كامپیوتری وارد سازوكار «مردودی» میشوند و به طور دستی مورد بررسی مجدد قرار میگیرند. هماكنون در سطح محدودی از OCR در پست كشور ما نیز استفاده میشود، چون در پست هم كد پستی چندرقمی و دیگر اطلاعات به صورت گسسته و داخل كادرهایی نوشته میشود، و كار آسانتر است.
در مورد خطای OCR در تشخیص كلمات، مسئولان شركت «پایا» نظر جالبی دارند:
«حتی با تعبیة سیستم مردودی (reject) هم ممكن است خطایی در تشخیص كلمات وجود داشته باشد. باید در نظر داشته باشیم كه هیچ سیستم پردازشگری (از جمله انسان) بدون خطا نیست. نكته مهم این است كه یك سیستم ماشینی درصد خطای كمتری نسبت به انسان داشته باشد تا جایگزین خوبی برای انسان باشد. مسئله این نیست كه خطا را به صفر برسانیم. هر قدر كه فناوری جلوتر میرود، میزان خطا هم بیشتر كاهش مییابد.»
مدیر شركت «دوران نوین» هم به گونهای دیگر به همین موضوع اشاره میكند: «انتظار ما از مسئولان طرح «تكفا» آن است كه با موضوع OCR واقعبینانهتر برخورد شود، و در بحث مربوط به هزینههای پروژه و انتظاراتی كه از OCR میرود، واقعیتها در نظر گرفته شود. دیدگاه كنونی مسئولان تكفا آن است كه كل مشكل «خطا» تا 100درصد حل شود، در حالی كه فكر میكنم حل مسائل مربوط به هوش مصنوعی نیاز به روش تدریجی دارد. مثلاً در زبان عربی هم، نرمافزار «صخر» در نسخة اول خود فقط تا حدود 40درصد دقت داشت، در حالی كه اكنون پس از گذشت 13 سال از اولین نسخه آن دقت به مرز 98 درصد رسیده است.»
همانطور كه اشاره شد از OCR در ثبتنام آزمون «سازمان ملی استعدادهای درخشان» در سالهای 81 و 82 استفاده شد كه از طریق آن 000,440 نفر به طور ماشینی ثبتنام شدند. این روش باعث شد كه در سال 81 (نمونه اول) 45 درصد در هزینهها و 25 درصد در زمان ثبتنام صرفهجویی شود. در سال بعد (82) این رقم به 50 درصد رسید. نرمافزاری كه در این آزمونها مورد استفاده قرار گرفت برای هر كدام از موارد صحت بازشناسی متفاوتی داشت و در مجموع كار آن خوب بود (به جدول توجه كنید):
به نظر میآید كه در چند سال آینده و با پیشرفت OCR فارسی و كاهش هر چه بیشتر خطای آن، در آزمونهای بزرگتری مانند آزمون سراسری دانشگاهها نیز بتوان از آن استفاده كرد.
سرنوشت OCR دستنویس
در مورد OCR پیوسته دستنویس نیز روند كار به همان صورتی است كه شرح دادیم، اما آنچه كار را دشوارتر میكند، قطعهبندی و جداجدا كردن حروف به هم چسبیده و تشخیص آنهاست. اگر این روند طی شود، این امید وجود دارد كه روزی از OCR پیوسته دستنویس فارسی هم در سطح گستردهای استفاده شود. البته OCR پیوسته دستنویس حتی در زبان انگلیسی هم هنوز به كاربرد وسیع و عملی نرسیده است. مهندس «رزازی» دراین مورد میگوید: « OCRانگلیسی در سیستم عامل windows وجود دارد كه همراه با office فروخته میشود، ولی فكر نكنید كه نامههای اداری انگلیسی كه با دستنویس نوشته شدهاند همه با OCR تایپ میشوند. این كار برای به نتیجه رسیدن به حداقل یك روند 10 ساله را باید طی كند. OCR فارسی یك مرحله عقبتر است، پس زمان بیشتری میبرد.»
مهندس «صدیق»، مدیرعامل شركت «پایا» هم میگوید: «همین OCR فارسی گسسته هم تا چند سال پیش یك رؤیا بود، ولی دیدیم كه محقق شده است و به مرور پیشرفتهتر هم خواهد شد. بنابراین طراحی OCR پیوسته فارسی هم، اگرچه سالها طول میكشد، ولی مطمئناً به نتیجه خواهد رسید. این طرح یك طرح تحقیقاتی است كه در دانشگاهها دنبال میشود و هنوز به یك محصول صنعتی قابل استفاده در سطح كلان و كاربردی برای عموم نرسیده است. ولی در حال حاضر نمونههای دانشگاهی و آزمایشگاهی آن در داخل كشور وجود دارد و موضوع رساله دكتری برخی از دانشجویان است.»
بنابراین بین 10 تا 20 سال آینده، آنگونه كه مسئولان شركت «پایا» میگویند، OCR پیوسته دستنویس فارسی هم وارد بازار خواهد شد.
دكتر فیلی هم در پاسخ به این سؤال كه «آیا طراحی OCR پیوستة فارسی روزی تحقق خواهد یافت؟» پاسخ میدهد: «بله ولی به تدریج.»
به هر حال براساس قرارداد «تكفا» با شركتهای ایرانی، تا كمتر از یك ماه دیگر، نسخهنهایی (البته نه صددرصد تكمیلشده) OCR فارسی دستنویس گسسته و تایپی پیوسته ارائه خواهد شد. مدیر شركت «دوران نوین» در این مورد میگوید: «پروژة OCR گسسته در مراحل پایانی خود قرار دارد ولی دارای مشكلاتی در تشخیص انواع اسكنرها و انواع فونتهاست كه در حال رفع آن هستیم. این نرمافزار در حال حاضر امكان تشخیص فونتهای تایپی فارسی با دقت زیاد را دارد، ولی مشكل جدی آن است كه با اسكنرهای مختلف نتایج نامناسبی میدهد.» وی از اهمیت این طرح در بعد كلان ملی هم میگوید: «با توجه به این كه مشكل OCR برای بسیاری از زبانهای دنیا مانند انگلیسی عملاً حل شده است، اگر در كشور ما هم به نتیجة نهایی برسد در افزایش سطح اطلاعات فارسی در دنیای دیجیتالی امروز (از جمله در اینترنت) بسیار اهمیت خواهد داشت.
منبع: پایگاه تحصصی نرمافزار
چهارشنبه 4/6/1388 - 6:17
آموزش و تحقيقات
چگونه آب میوه ها می توانند برای سلامتی مفید یا مضر باشند؟
شاید فکر کنید که تمام آبمیوه ها یکسان باشند. راه های زیادی وجود دارد که مردم به وسیله آنها بین آب میوه های مختلف، تفاوت قائل می شوند. مثلا: طعم، نام تجاری و یا حتی قیمت! اما خیلی بیشتر از آنچه شما یک آبمیوه را هنگامی که در یخچال یک فروشگاه قرار دارد می بینید، وجود دارد. بسیاری از آب میوه ها شامل ترکیباتی هستند که برای شما مفید هستند و بسیاری دیگر با شکر و یا طعم دهنده های مصنوعی پر شده اند که می تواند برای سلامتی بسیار مضر باشد.
بسیار مهم است که بدانید چه آب میوه ای برای شما مفید است و از کدام یک باید دوری کنید. مخصوصا تا هنگامی که بسیاری از افراد این محصولات را بدون حتی اندکی فکر استفاده می کنند . یکی از مورد اعتماد ترین نوع آبمیوه ها، آب میوه ای است که روی آن نوشته شده است" صد در صد خالص " .این به این معنی است که آب میوه دارای هیچ ماده شیرین کننده ای نیست . این خوب است اما معنای حقیقی آن روی واقعیت را می خراشد! آبمیوه هایی که 100% طبیعی هستند، واقعا مفید هستند اما در حقیقت این نوع آبمیوه ها دارای مقادیر بالایی شکر و کالری هستند. مطالعات نشان می دهد که آبمیوه هایی که 100% طبیعی هستند حتی بیشتر از یک شکلات شکر دارند! بهترین راه حل برای لذت از این نوع آبمیوه ها این است که خود را به خوردن یک لیوان در روز محدود کنید. اما اگر نمی توانید عادت خود را کنار بگذارید و از طرفی هم با شکر و کالری موجود در این آبمیوه ها مشکل دارید، می توانید این مشکل را با رقیق کردن آب میوه با آب جبران کنید.
هزاران تن ار تولیدات آبمیوه ای در سوپر مارکت ها وجود دارد که " نوشابه های میوه ای "، " نوشیدنی های مرکب " و " آشامیدنی های طعم دار" نام گرفته اند. از تمامی این ها می توانیم اجتناب کنیم چرا که نسبت به آب میوه های طبیعی دارای مقدار زیادی شکر و کالری هستند که به شربت های فراکتوز دار معروفند.
مقدار آب میوه ای که این شربت ها دارند بسایر اندک است و به همین دلیل هیچ ماده مغذی ندارند.این نوع آبمیوه ها برای سلامتی کودکان بسیار مضر هستند و و مصرف آنها در کودکان باعث چاقی و سایر بیماری ها می شود. اگر واقعا به سلامتی خود و خانوادتان اهمیت می دهید، در این صورت باید تغذیه خود را از مواد مصنوعی به طبیعی تغییر دهید. همیشه به دنبال آب میوه هایی از گیلاس، انار، تمشک آبی، آلو و پرتقال باشید. این چنین آب میوه ها با آنتی اکسیدان های مقوی ای غنی شده اند و بالطبع دارای مقدار اندک شکر و کالری هستند. نتیجه این امر این است که شما با استفاده از آبمیوه های طبیعی به جای نوشیدنی هایی که با مواد مصنوعی طعم داده شده اند، به بهترین نتیجه خواهید رسید.
هنگامی که نوبت به شربت پرتقال می رسد، بهترین کار ممکن این است که از آب پرتقالی استفاده کنید که شیرین شده نباشد و دارای کمترین حد کالری باشد. اما در هر حال این نوع آب پرتقال دارای مقدار کمتری آنتی اکسیدان نسبت به سایر آب پرتقال هاست.
آیا تا به حال به میزان آب میوه ای که فرزندتان باید استفاده کند توجه کرده اید؟ طبق گفته متخصصین اطفال، کودکانی که سن آنها کمتر از شش سال است باید مقدار نوشیدنی آنها بین 130گرم تا 170گرم در هر روز باشد و در سنین 7 تا 18 سال می توانند مصرف خود را بین 227 گرم تا 340 گرم در روز افزایش دهند.
سه شنبه 3/6/1388 - 5:36