اينترنت و شيوه هاي جستجو در آن

 

 

 

مقدمه

 

تاريخچه ي اينترنت و جستجو در آن

"شبکه جهاني اينترنت در اواخر دهه 1960 پا به عرصه ي ظهور گذاشت. اما تا سال 1990 ابزاري براي کاوش اطلاعات موجود در اينترنت وجود نداشت. با مروري اجمالي بر تاريخچه ي ابزارهاي کاوش اينترنت مي توان دريافت که تقريباً کليه ي پيشرفتها در اين زمينه توسط دانشجويان و طرحهاي پژوهشي آنها صورت گرفته است. در سال 1990 اولين ابزار کاوش اينترنت توسط آلان امتيچ[1] در دانشگاه مک گيل تحت عنوان Archie توسعه يافت. آرکي از طريق نمايه سازي فايل هاي موجود در سايت هاي FTP  امکان جستجو و بازيابي فايل ها در محيط اينترنت را براي کاربران فراهم ساخت. در سال 1993 براي بازيابي اسناد و متون در سرورهاي گوفر نظامي مشابه آرکي طراحي شد که Veronica نام داشت.  در واقع مي توان گفت آرکي و ورونيکا پدر و مادر همه ابزارهاي کاوش امروزي به شمار مي آيند.

                پس از گذشت يک سال از ظهور شبکه ي جهاني وب، دو ابزار کاوش براي جستجوي اطلاعات در محيط وب توسعه يافتند که عبارت بودند از: World Wide Web Wanderer و ALIWEB .  World Wide Web""  که توسط ماتئوگري[2] در دانشگاه MIT توسعه يافت، از روبات ها يا به تعبير ديگر برنامه هاي کامپيوتري براي جستجو و نمايه سازي صفحات وب استفاده مي کرد. به اين ترتيب، اولين موتور کاوش وب مبتني بر نمايه سازي خودکار و ماشيني پا به عرصه ي ظهور گذاشت و اولين پايگاه يا نمايه ي موتور کاوش تحت عنوان وندکس[3] شکل گرفت."4

                "در اوايل سال 1994 دو دانشجوي دوره دکتري مهندسي برق فهرستي از سايت هاي وب مورد علاقه خود را تهيه و در محيط وب ارائه کردند. سپس به منظور جستجو در پايگاه اطلاعاتي گرد آوري شده از سايت ها، نرم افزار کاوشي به آن افزودند و آن را Yahoo نام نهادند. در سال 1994 موتورهاي کاوش ديگري ابداع شدند که هم از نظر بازيابي اطلاعات و هم از نظر پوشش منابع در شبکه جهاني وب قابليت ها و امکانات بهتري داشتند. مانند:  Lycos،  Infoseek،open text. در دسامبر 1995 AltaVista به عنوان يکي از شناخته شده ترين موتورهاي کاوش ظهور پيدا کرد.AltaVista اولين موتورکاوشي بود که از زبان طبيعي و عملگرهاي بول براي بازيابي اطلاعات در محيط وب استفاده کرد."10  "در اواخر سال 1997 يکي از بزرگترين و مهم ترين ابزارهاي کاوش امروزي يعني موتور کاوش Google ظهور يافت.Google  تلاش کرد که در نظام رتبه بندي نتايج کاوش خود مبتني بر ميزان ارتباط آن با کليدواژه هاي جستجو تحول اساسي به وجود آورد که از طريق استفاده از معيار ميزان استناد به يک صفحه يا سايت مشخص توسط سايت هاي ديگر صورت مي گيرد.

همراه با رشد روز افزون اطلاعات در محيط اينترنت، تعداد ابزارهاي کاوش نيز به طور فزاينده اي افزايش يافت. به طوري که تا ژوئن 2001، يکي از راهنماهاي ابزارهاي کاوش اينترنت به نام Search Engine Guide مدعي است 2500 موتورکاوش و راهنماي موضوعي در زمينه هاي موضوعي مختلف را در پايگاه خود نمايه کرده است."4

در پايان اشاره به اين نکته ضرورت دارد كه داشتن شناخت کافي از ابزارها و امکانات جستجو در شبکه ي جهاني وب از جمله مباحث مهمي است که نه تنها کتابدران و متخصصان اطلاع رساني، بلکه بسياري از استفاده کنندگان نهايي بايد براي رويارويي با حجم فزاينده ي اطلاعات از آنها آگاهي داشته باشند.

 ضرورت و اهميت جستجو در اينترنت

"اين سوال ممکن است در ذهن بسياري از ما همواره مطرح باشد که چرا بايد به شبکه ي جهاني وب و اطلاعات موجود در آن بها دهيم. آيا محيط وب نسبت به ديگر رسانه ها مزايا و ارزش هاي افزوده اي دارد مطالعه صورت گرفته توسط دانشگاه کاليفرنيا نشان مي دهد که استفاده کنندگان از اينترنت پس از کتاب و روزنامه، اينترنت را مهم ترين منبع اطلاعاتي مي دانند. نکته جالب در اين پژوهش،  پيشي گرفتن اينترنت از رسانه هاي راديو و تلويزيون است. در پاسخ به اين سوال که چرا بايد در شبکه جهاني وب به جستجوي اطلاعات پرداخت، مي توان چند دليل عمده را بر شمرد:

1.منحصر به فرد بودن

2. روز آمد بورن

3. رايگان بودن

4. سهولت جستجو و بازيابي اطلاعات

5.دسترسي به اطلاعات چند رسانه اي"4

"و اما هدف هر هدف هر جستجوگر گرفتن بهترين نتيجه از هر جستجو مي باشد. در کل مي توان گفت جستجوگران هدفهاي زير را دنبال مي کنند:

با توجه به شرايط جستجو اين اهداف بايد انعطاف پذير باشند؛ گاهي اوقات هدف اساسي جستجوگر بازيابي همه اقلام مرتبط مي باشد، اينکه چه تعداد از اقلام ممکن است بازيابي شود اهميت ندارد.

 

جستجوي اطلاعات

                "در هر جستجويي حداقل دو عامل موثر است: يكي نظام پرسش و ديگري پرسش. هر گونه اطلاعات سازمان دهي شده را نظام و به هر درخواستي براي اطلاعات پرسش گفته مي شود. براي از ميان برداشتن فاصله ميان نظام و پرسش جستجوگر با انجام برخي فعاليت ها كه فرايند جستجو ناميده مي شود، بين اين دو پيوند برقرار مي شود.

                مارچيونيني[4] ،(1993) جستجوي اطلاعات را نوعي فعاليت  «حل مسئله» مي داند. اين فعاليت ها داراي خرده فعاليت هاي زير است:

  1. تشخيص مسئله
  2. انتخاب نظام جستجو
  3. مفهم پردازي پرسش
  4. فرمول بندي پرسش
  5. اجزاي جستجو
  6. ارزيابي نتايج" (1: 66)

 

 

جستجوي اطلاعات در اينترنت

"مهمترين سوال اين است كه چگونه مي توانيم در اينترنت به جستجوي اطلاعات بپردازيم. براي نجات از سردرگمي در جستجوي بي فايده در اينترنت برداشتن سه گام ضروري است.

  1. بايد راه هاي مشخصي براي دسترسي وجود داشته باشد كه امكان اشتباه كردن و از دست دادن زمان را كاهش دهد.
  2. بايد دانش كافي در حوزه هاي مورد علاقه فردي كه به جستجو مي پردازد وجود داشته باشد.
  3. بايد نسبت به افزوده ها و روش هاي جديد جستجو در اينترنت هوشياري مستمر وجود داشته باشد.

براي جستجو اطلاعات در اينترنت ابزاري به نام موتور هاي جستجو وجود دارد. موتورهاي جستجو نرم افزارهاي كاربردي محيط وب هستند كه براي جستجو انواع منابع اطلاعاتي موجود در اينترنت طراحي شده اند و با نمايه سازي منابع اطلاعاتي امكان جستجوي كليدواژه، عبارت و ساير قابليت هاي جستجو بر روي سايت هاي مختلف فراهم مي آورند."( 1: 83- 84)

 

موتور هاي جستجو

"قابليت هاي موتورهاي جستجو به طور مرتب در منابعي نظير search engine watch[5]  مورد مطالعه و مقايسه قرار مي گيرد.موتورهاي جستجوي وب را مي توان به دو دسته عمومي و تخصصي تقسيم كرد. موتورهاي جستجوي عمومي مانند (NORTHERLIGHT  يا ALTAVISTA  ) دسترسي عام در وب را ميسر مي سازند، ولي موتورهاي تخصصي نظير وب ALIDRISI كاربرد تخصصي دارند.

در زير شش موتور جستجوي عام معرفي شده اند:

1.Yahoo                          http://www.yahoo.com

اين موتور جستجو كه از نوع موتورهاي جستجوي راهنماي موضوعي[6] است در سال 1994 راه اندازي شد. yahoo كلمه اختصاري عبارتYet Another Hierarchically Officious Oracle به عنوان شناخته ترين موتورهاي جستجوي موضوي به شيوه سلسله مراتبي يا درختي طراحي شده و هزاران سايت، صفحه يا مدرك، گروه هاي خبري و نشانه هاي الكترونيكي افراد و سازمان ها را در يك ساختار سلسله مراتبي موضوعي و جامع آماده بازيابي كرده است. داراي رده هاي اصلي و فرعي موضوعي است وجستجو به صورت تقسيمات موضوعي از موضوعات كلي تر به موضوعات جزئي و جزئي تر امكان پذير است. به علاوه براي تسهيل بازيابي امكان جستجوي كليدي واژه اي از موضوعات  را نيز در اختيار مي گذارد. داراي دو شيوه جستجوي ساده و پيشرفته است و امكانات عملكرد هاي منطقي، جستجوي عبارت و كوتاه سازي واژه ها را عرضه مي كند. نتايج جستجو به همراه توصيفي كوتاه از وب سايت هاي بازيابي شده ارائه مي شود.

اين موتور جستجو كه از نوع موتور هاي جستجوي راهنما(DIRECTORY) است، پر استفاده ترين و رايج ترين موتور جستجو مي باشد. يا هو داراي رده هاي اصلي و پايه  موضوعي است و جستجوي صفحه وب، نشانه هاي الكترونيكي افراد و سازمان ها و گروه هاي خبري را براي استفاده كنندگان امكان پذير مي سازد. معمولا از اين ابزار جستجو براي جستجوي اطلاعات عمومي تر در اينترنت استفاده مي شود.

2. Google                       http://www.Google.com

يكي از كارآمد ترين موتور هاي جستجو است كه طي سال هاي اخير توسعه يافته و وب سايت ها، اخبار مدارك تصويري، امكانات( pdf )  اسناد دولتي را بازيابي مي كند. داراي جستجو ساده و پيشرفته است. در جستجوي پيشرفته مي توان از انواع عملكردهاي منطقي استفاده كرد. در صورتي كه چند كلمه بدون امكان تركيب منطقي وارد عنوان شوند عملكرد دقيق تر AND  پيش فرض محسوب مي شود.براي جستجو مي توان عبارت را داخل « » قرار داد. اين موتور جستجو علاوه بر جستجوي كليد واژه اي داراي راهبرد جستجوي موضوعي است كه در آن اطلاعات منابع تحت پو شش به صورت طبقه بندي شده ارائه مي شوند. نتايج جستجو به صورت رتبه بندي شده همراه چكيده اي از محتواي اطلاعاتي سايت ها عرضه مي شود. اين موتور داراي امكانات وسيعي براي اولويت بندي يا محدود كردن جستجو هاست. مي توان جستجو ها را به زبان، محل جستجو يا منابع خاص محدودكرد.  

   Google فهرست نتيجه جستجوي شما را بر اساس تعداد استفاده ديگران از پايگاه هاي مشهوري چون Yahoo رتبه بندي مي كند.

3. Excite                                     http://WWW.excite.com

پايگاه اطلاعاتي اين موتور جستجو شامل اخبار و گروه هاي خبري، فهرست هاي پستي و صفحات وب مي باشد. اين جستجوگر داراي قابليت هاي جستجوي متن كامل صفحات وب، كليد واژه، حذف كلمات فاقد بار اطلاعاتي مانند حروف اضافه و ...،استفاده از عملكردهاي منطقي (AND,OR,NOT ) با استفاده از پرانتز براي تركيب و يكپارچه سازي جستجوي بولي است. اين نرم افزار فرآيند جستجو و بازيابي اطلاعات را با پيوند خود كار فرامنتي، دسته بندي موضوعي و چكيده سازي تكميل مي كند. جستجوي انواع اطلاعات نظير شغل، آموزش، سرگرمي، ورزش و ... از طريق« كانال هاي » مختلف و زير مجموعه هاي مربوطه امكان پذير است. موتور جستجوي Excite فن آوري جستجوي«مبتني بر مفهوم » و به شمار آوردن هم معني ها و موضوعات مرتبط بهره مي گيرد كه ممكن است جستجوگر در فرمول بندي جستجوي خود به آن ها فكر نكرده باشد اگر واژه مورد نظر دقيقا در مدرك ذكر نشده باشد اين گروه از موتور هاي كاوش با استفاده از مهارت هاي زبانشناختي و روش هاي بازيابي هوشمند مفاهيم (ICE)   INTELIGENT CONCEPT EXTRATION )   )  به ايجاد شبكه هاي مفهومي براي جستجو مي پردازد. اكسايت نتايج جستجو را بر اساس ميزان ارتباط آن ها با واژه مورد جستجو رتبه بندي مي كند و براي آگاهي از محتواي هر صفحه توصيفي كوتاه از آن ارائه مي شود.

.4  Altavista                              http://www.altavista.com

آلتاويستا يكي از جامع ترين موتورهاي جستجو در وب است كه امكان جستجو در صفحات و گروه هاي خبري را فراهم آورده است. اين موتور جستجو هر صفحه از يك سايت را به منزله يك مدرك در نظر مي گيرد و واژه هاي نمايه سازي را از هر صفحه اي برمي گزيند. بر اين اساس واژه هاي بسياري نمايه سازي مي شوند. اين شيوه موجب مي شود در برخي جستجوها منابع يا مدارك زيادي بازيابي شوند، به عبارت ديگر از ضريب بازيافت بسيار بالايي برخوردار است. اين  ابزار جستجو داراي امكانات با ارزشي نظير: جستجوي بولي، جستجوي حروف بزرگ و كوچك، جستجوي عبارات، بر حسب ضروري يا غير ضروري، محدود كردن جستجو، كوتاه سازي واژه ها و استفاده از پرانتز براي گروه بندي عبارات جستجو است. براي رتبه بندي ميزان ارتباط منابع بازيابي شده، با فرمول جستجو بايد از گزينه جستجوي پيشرفته استفاده كرد. استفاده از امكان refine  در اين پايگاه جستجو باعث مي شود كه نتايج جستجو به طور خودكار مورد پالايش قرار گرفته و در قالب موضوعات مختلف مرتبط با كليدواژه هاي مورد جستجو طبقه بندي گردند. در واقع گروه ها و طبقه هاي مختلف در اختيار كاربر گذاشته مي شود تا از ميان آن ها انتخاب كند.

                    اين موتور جستجو داراي دو شيوه جستجوي ساده و پيشرفته است . در جستجوي ساده چنانچه چند واژه بدون تركيب منطقي وارد شوند موتورجستجو پيش فرض بولي OR را اجرا خواهد كرد. جستجو مي تواند به وب سايت هاي زباني خاص محدود شود. اين موتور جستجو علاوه بر زبان انگليسي بسياري از وب سايت هاي به زبان هاي مختلف دنيا مانند چيني، ژاپني، فرانسوي، ايتاليايي، آلماني، روسي و ... را تحت پوشش دارد. اين موتور جستجو همچنين خدمات ترجمه خودكار را به ياري نرم افزار(SYSTRAN) عرضه مي كند. عبارت هاي جستجو يا وب سايت ها از انگليسي به فرانسوي، ايتاليايي، پرتغالي و اسپانيولي و برعكس ترجمه مي شوند. نتايج جستجو را مي توان به صورت معمولي، فشرده و يا با جزئيات بيشتر مشاهده كرد.

5.Lycos                                      http://www.lycos.com

اين موتور جستجو كه از ابزارهاي جستجوي قديمي محسوب مي شود، صفحات وب را به صورت هفتگي در پايگاه اطلاعاتي (نمايه) خود روزآمد مي كند. پايگاه اطلاعاتي اين موتور جستجو شامل صفحات وب، گوفر و فايل هاي قابل انتقال مي باشد. اين موتور جستجو عنوان، سرعنوان ها و عناوين فرعي، بيست سطر نخست و مهمترين 100 واژه وب سايت ها را نمايه سازي مي كند. علاوه بر جستجوي مدرك، توانايي جستجوي تصاوير و فايل هاي صوتي را نيز داراست. جستجوي موضوعات و كليدواژه، حذف واژه هاي فاقد بار اطلاعاتي، جستجوي عنوان و امكان نمايش اطلاعات بازيابي شده با توجه به ميزان ربط آن ها در سه سطح معمولي، فشرده و همراه با جزئيات از قابليت هاي اين موتور جستجو است.

6. Infoseek                                          http://www.infoseek.com

موتور جستجو Infoseek كه به نام GO NETWORK نيز شناخته  مي شود، شامل صفحات وب، گروه هاي خبري، راهنما و نشاني هاي پست الكترونيكي افراد و سازمان ها، برخي از سايت هاي انتخابي و پرسش و پاسخ هاي متداول مي باشد. پايگاه هاي اطلاعاتي اين موتور جستجو به طور روزانه روزآمد مي شود. از قابليت هاي آن مي توان جستجوي تمام متن، جستجوي كلمات با حروف بزرگ و كوچك، جستجوي عبارات، جستجوي كلمات همجوار، استفاده از واژه هاي ضروري و غير ضروري ( با استفاده از علائم + و - ) و حذف واژه هاي غيراطلاعاتي را نام برد. با كمك اين ابزار كاربر مي تواند جستجو را به كشورها يا نواحي جغرافيايي خاصي محدود كند." (1: 85- 89)

 

راهبرد جستجو در اينترنت

"راهبرد جستجو عبارت است از فرآيندي كه از طريق آن فايلي مورد جستجو قرار گيرد تا مدارك متناسب با نياز كاربر شناسايي شود. هر فرآيند جستجو مي تواند به مراحل زير تقسيم شود:

ارائه درخواست دقيق

انتخاب منابع اطلاعاتي

آماده كردن جستجو

اجراي جستجو

براي جستجو اطلاعات در شبكه اينترنت حداقل دو شيوه وجود دارد: شيوه نخست رهيابي به اطلاعات از طريق مكان ياب جهاني منابع   URL[7] است. مكان ياب جهاني منابع دسترسي به منابع گوناگون اينترنت با نشاني هاي گوناگون را فراهم مي كند. هر پايگاه وب يك نشاني دارد كه اصطلاحا به آنURL مي گويند. اگر نشاني پايگاه اطلاعاتي را بدانيد آن را در سطر نشاني برنامه مرورگر(Browser) وب تايپ كنيد و برنامه مرورگر، شما را به وب سايت آن نشاني هدايت خواهد كرد.

شيوه دوم كه رايج تر است،اين است كه كاربر نشاني خاصي را در دسترس ندارد. در اين شيوه كاربر صفحه ها يا مدارك مورد نياز خود را با وارد كردن كلمه يا عبارت موردنظر از طريق موتورهاي حستجو بازيابي مي كند( فتاحي، 1378)." (1: 91- 93)

 

جستجوي ساده و پيشرفته

"به طور معمول اكثر موتورهاي جستجو دو شيوه را براي جستجوي اطلاعات در اختيار قرار مي دهند:

  1. جستجوي ساده يا Simple Search
  2. جستجوي پيشرفته يا Power Search  يا Advanced Search  يا Advanced Query

در اغلب موتورهاي جستجو ابتدا صفحه" جستجوي ساده" در اختيار كاربر قرار مي گيرد. در اين صفحه مي توانيد كلمه يا عبارت مورد جستجو را تايپ و با زدن كليد Enter يا اشاره موشواره روي گزينه Search يا GO نتايج موردنظر را پس از جستجو ملاحظه كنيد. اين شيوه اغلب با بازيافت زياد و دقت كم همراه است. چه بسا مدارك و منابع بسيار زيادي بازيابي شوند ولي كم ربط يا بي ربط به موضوع مورد جستجو باشند. در شيوه دوم امكانات متنوعي نظير انواع عملكردهاي منطقي براي تركيب واژه هاي جستجو، راهبردهاي مختلف جستجو و محدودگرهايي مانند زباني، زماني، مكاني، شكلي و موضوعي در اختيار جستجوگران قرار مي گيرد. با استفاده از اين امكانات جستجوگر مي تواند منابع مرتبط تر را ارزيابي كند." (1: 97- 98)

 

 

جستجو از طريق عملگرهاي بول[8]

 

جرج بول يك رياضيدان و منطق دان بريتانيايي قرن نوزدهم بود كه در سال 1847 از علائم رياضي براي بيان فرآيند هاي منطقي استفاده نمود كه امروزه اساس بازيابي اطلاعات در بسياري از پايگاه هاي اطلاعاتي و همچنين ابزارهاي كاوش اينترنت است. با استفاده از اين عملگرها مي توان مفاهيم مختلف (كليد واژه ها) را با هم تركيب كرد و به اين ترتيب با گسترش يا كاهش دامنه جستجو نتايج مرتبط تري بازيابي كرد. از اين روش براي جستجو در تمامي پايگاه هاي اطلاعاتي در محيط وب يا غير از آن مي توان استفاده كرد. 9

لازم به ذكر است كه برخي از ابزارهاي كاوش فقط در صورتي كه عملگرهاي بول با حروف بزرگ (AND, OR  و... ) نوشته شوند٬ آنها را اجرا مي كنند. يعني اگر عملگر هاي بول در اين دسته از ابزارهاي كاوش با حروف كوچك (and,or و... ) در كادر جستجو وارد شوند٬ قابل اجرا نخواهند بود و آگاهي از اين موضوع اهميت بسزايي دارد بنابراين به طور كلي توصيه مي شود كه كاوشگران براي جلوگيري از هر گونه مشكلي هميشه از حروف بزرگ در درج عملگرهاي بول استفاده كنند. 7

جهت مقايسه توانايي ارائه اين عملگرها توسط موتور كاوش هاي مختلف مي توانيد به جدول شماره 1 در پيوستي كه در انتهاي تحقيق ارائه شده است مراجعه فرماييد.

عملگر AND:استفاده از عملگر AND در جستجو دو يا چند واژه كليدي (كه همگي بايد در نتايج نمايش داده شوند) يك استراتژي عالي براي انجام جستجوهاي دقيق و عمدتا" كاهش تعداد نتايجي است كه بايستي مورد بررسي قرار بگيرند. 1 در واقع عملگر AND قيد بايد را تداعي مي كند. يعني همه كليدواژه هايي كه از طريق اين عملگر با يكديگر تركيب مي شوند٬ بايد در نتايج كاوش وجود داشته باشند. البته بايد توجه داشت كه در برخي از موارد استفاده از عملگر در ابزارهاي كاوش منجر به بازيابي اطلاعات مرتبط نمي شوند زيرا كليدواژه هاي مورد نظر ممكن است در هر كجاي متن يك صفحه وب به كار رفته باشند بدون آنكه هيچگونه مفهومي با هم داشته باشند. اين موضوع يكي از اصلي ترين مشكلات بازيابي اطلاعات مرتبط در محيط وب است. 4

با اين وجود جهت آشنايي با اين عملگر براي مثال چنانچه به دنبال اطلاعاتي هستيد كه شامل هر دو كليدواژه Internet و Search باشند مي توان آنها را به صورت Search AND Internet تركيب كرد. بدين ترتيب كليه صفحات وبي كه در آنها اين دو كليدواژه به كار رفته است بازيابي خواهد شد. اين ارتباط بولي را مي توان توسط يك نمودار ون جهت روشن شدن مفهوم عملگر AND به صورت زير نمايش داد (نمودارشماره1). 9

نمودار شماره1 . بخش مشترك در تصوير فوق نتيجه تركيب دو كليدواژه Internet و Search از طريق عملگر

AND است. اين عملگر نقاط مشترك بين دو مجموعه پايگاه هاي اطلاعاتي را بازيابي مي كند.

                براي مشخص نمودن اين نكته كه عملگر AND باعث كاهش دامنه جستجو مي باشد نتيجه جستجو كليدواژه هاي بالا در عناوين سايت هاي وب به طور جداگانه  و نيز تركيب آنها از طريق عملگر AND در موتور كاوش Yahoo روي نمودار شماره 2 نشان داده شده است:

                                 

1- Internet………1,630,000                                                                                                                                                 

2- Search………..3,470,000

3- Internet AND Search………727,000

           

 

لازم به ذكر است كه برخي از موتورهاي جستجو از گزينه هاي ديگري چونMust Include يا all the words براي اجراي عملگر AND استفاده مي كنند. بنابراين با انتخاب اين گزينه ها كاوشگران مبتدي هم مي توانند از قابليت هاي كاوش اين موتورهاي جستجو استفاده كنند. كافي است دو يا چند كليدواژه مورد نظر را تايپ كرده و سپس گزينه مربوط به اجراي عملگر AND را از منوي دستوري اين موتورها انتخاب كنيد(شكل شماره1). 5

Text Box:  

 

 

شكل شماره 1 . تصويري ازصفحه جستجوي پيشرفته موتوركاوش Yahoo و گزينه all of these words كه كار عملگر AND را انجام مي دهد.

 

در آخر لازم به ذكر است كه اين عملگر يكي از مهم ترين و پراستفاده ترين شيوه ها براي محدود كردن دامنه جستجو در محيط وب مي باشد و تقريباً همه ابزارهاي كاوش وب اين عملگر را مورد حمايت قرار مي دهند. بايد توجه داشت كه براي دسترسي به نتايج كاوش مشخص تر و كمتر مي توان بيش از دو كليدواژه را با يكديگر تركيب كرد اما برخي ابزارهاي كاوش براي تركيب بيش از سه يا چهار كليدواژه با يكديگر محدوديت قائل مي شوند. 4

 

عملگر OR : عملگرOR بدين معني است كه هر يك از عبارات جستجو و يا چند مورد از آنها كه در شرح جستجو هستند بايد در اقلام بازيابي شده وجود داشته باشند٬ 8 اما در عين حال وجود بيشتر از يكي از آنها ضروري نيست. به عبارت ديگر عملگر OR برخلاف عملگر AND باعث گسترش دامنه جستجو و بازيابي اقلام اطلاعاتي بيشتر مي شود. در واقع٬ عملگر OR قيد هر يك را تداعي مي كند. به اين معنا كه هر يك از كليدواژه هاي جستجو(يكي يا همه آنها) مي توانند در نتايج وجود داشته باشند. 2

                براي مثال چنانچه به دنبال اطلاعاتي هستيد كه شامل كليدواژه هاي Internet و Search باشند مي توانيد آنها را به صورت Search OR Internet تركيب كنيد. بدين ترتيب صفحات وبي بازيابي خواهند شد كه در آنها يا كليدواژه Internet ياكليدواژه Search و يا هر دو آنها وجود داشته باشند. نمودار ون اين ارتباط بولي را مي توان به صورت زير نمايش داد(نمودارشماره 3). 1

 


 

Internet          Search

 

نمودار شماره3. بخش رنگي در نمودار فوق تركيب دو كليدواژه Internet وSearch از طريق عملگر OR است. بخش مشترك بين دو مجموعه حاوي هر دو كليدواژه است و بخش هاي غير مشترك حاوي يكي از آن هامي باشد.

 

جهت درك بهتر اين نكته كه عملگرOR باعث گسترش دامنه جستجو و بازيابي اقلام اطلاعاتي بيشتر مي شود مي توان تفاوت بازيابي هر يك از كليدواژه هاي Internet و Search را به طور جداگانه و سپس با استفاده از عملگر OR در موتور كاوش Yahoo روي نمودار زير ملاحظه فرماييد:

  

 

 

 

 


 

1- Internet…….1,630,000                                                                                       

2- Search……… 3,470,000

3- Internet OR Search…….. 4,380,000

                                                                                                                 

 

با توجه به توضيحات داده شده سوالي كه ممكن است مطرح شود اين است كه چه نيازي به استفاده از اين عملگر در حالي كه باعث افزايش حجم اطلاعات و دامنه كاوش مي شود است؟ در پاسخ مي توان اين گونه گفت كه نوعاً عملگر هنگامي به كار مي رود كه جستجوگر دقيقاً نمي داند از بين چندين كلمه مترادف، مترادف نزديك و املاهاي مختلف يك كلمه كدام يك در پايگاه اطلاعاتي به كار رفته است. بنابراين با استفاده از تركيب آن ها توسط عملگر مي تواند جامعيت را در بازيابي اطلاعات مورد نظر افزايش دهد و به نتيجه دلخواه و مطلوب خود برسد. براي مثال چناچه كاوشگري به دنبال بازيابي اطلاعاتي در زمينه كتاب و كتابداري باشد مي تواند به صورت زير عمل كند: 4

Library OR Librarian OR Librarianship

                لازم به ذكر است كه برخي از موتورهاي جستجو به صورت پيش فرض جستجو با استفاده از عملگر OR را انجام مي دهند. به عبارت ديگر، اگر چندين كلمه يا عبارت را تايپ كرده و بين هر كدام فاصله اي قرار دهيد، موتور جستجو فرض را بر اين مي گذارد كه مي خواهيد اطلاعاتي در مورد يكي از آن ها بيابيد. اما برخي از موتورهاي جستجو عملاً كلمه OR را بايد بين كليدواژه ها يا عبارات تايپ كنيد تا به نتيجه مطلوب برسيد. در برخي موارد هم كاوشگر مي تواند از گزينه هاي موجود چون Any Of the word يا Should Include كه موتورهاي جستجو دارا هستند استفاده نماييد(شكل شماره 2). 5

 

شكل شماره2. تصويري از صفحه جستجوي پيشرفته موتوركاوش AltaVista وگزينه any of these words كه كار عملگر OR را انجام مي دهد.

            عملگر NOT: عملگر NOT زماني بكار مي رود كه بر عدم وجود يك عبارت تاكيد داشته باشيم. عموماً استفاده از عملگر NOT يك يا چند كليدواژه را حذف مي كند 8 و به اين ترتيب باعث محدود كردن دامنه جستجو مي شود. اين عملگر هنگامي ارزش واقعي خود را نشان مي دهد كه پس از بازيابي اطلاعات در محيط وب متوجه شويم كه در اغلب نتايج بازيابي شده اصطلاحات و عبارات و كليدواژه هايي مدنظر ما نيستند. در واقع عملگر NOT قيد نبايد يا بجز را تداعي مي كند. به اين معنا كه در نتايج كاوش مي توان يك كليدواژه يا عبارت را ناديده گرفت. 3

                براي مثال چنانچه دنبال اطلاعاتي هستيد كه شامل كليدواژه Pollution باشند ولي نمي خواهيد به قسمت مرتبط با Water Pollution بپردازيد مي توان آن ها را به صورتPollution NOT Water تركيب كرد. بدين صورت اطلاعاتي بازيابي خواهند شد كه شامل كليدواژه اول باشند و عبارت دوم را در برنمي گيرند. جهت درك بهتر ارتباط بولي اين عملگر مي توانيد نمودار ون مربوط به آن را ملاحظه فرماييد(نمودار شماره5). 9

نمودار شماره 5.بخش رنگي نتيجه تركيب دو كليدواژه توسط عملگر NOT است. اين عملگر با حذف واژه Water از دامنه جستجو فقط بخشي را كه حاوي Pollution است بازيابي كرده است.

 

                تاثير كلي استفاده از عملگر NOT كه در واقع باعث كاهش دامنه جستجو مي شود را مي توان در بازيابي كليدواژه Pollution به تنهايي و با استفاده از عملگر براي حذف صفحات مربوط به كليدواژه Water در موتور كاوش Yahoo به صورت زير روي نمودار شماره 6 نمايش داد:

                                                                  

 

 

 

1- Pollution……. 48,400

2- Pollution NOT Water……. 25,200

 

 

           

نكته قابل توجه اين است كه در استفاده از عملگرNOT بايد دقت كافي را به عمل آورد زيرا در استفاده از اين عملگر اين امكان را وجود دارد كه بعضي از مطالب مفيد سهواً دور ريخته شود. 5

                لازم به ذكر است كه برخي موتورهاي جستجو Alta Vista از AND NOT به جاي عملگر NOT استفاده مي كنند. برخي ديگر از موتورهاي جستجو شامل گزينه هايي چون Exclude يا  Without the wordياMust NOT Include  مي تواند براي اجراي عملگر از آن ها استفاده كند(شكل شماره3). 5

                                    شكل شماره3. صفحه جستجوي پيشرفته Google وگزينه without the words به جاي عملگرNOT

 

 

 

عملگر نزديك يابي

 

            گاهي اوقات كه كاربر استفاده از عملگرAND را براي پاسخگويي به نيازش كافي نمي داند و در واقع صرف اينكه كليدواژه هاي مورد نظرش در صفحه هاي بازيابي شده وجود داشته باشند را نمي خواهد استفاده از عملگرNEAR مفيد واقع مي شود. چنانچه در موارد بسياري ديده مي شود كه عملگرAND فقط سعي مي كند صفحاتي را بازيابي كند كه در آن ها كليدواژه هاي مورد نظر قرار داشته باشند بدون اينكه حتي ارتباط مفهومي خاصي داشته باشند. بنابراين براي جلوگيري از بازيابي اطلاعات غير مرتبط در چنين مواردي، مي توان از جستجوي نزديك يابي استفاده كرد. 5 استفاده از اين روش، كاربرد فراواني دارد زيرا از طريق آن مي توان كليدواژه ها و مفاهيم مورد نظر را در كنار هم بازيابي كرد. به تعبير ديگر از طريق جستجوي نزديك يابي مي توان ارتباط مكاني و جايگاه كليدواژه ها را در كنار هم تعيين كرد. شايان ذكر است كه موتورهاي كاوش از طريق عملگرNEAR و در موارديADJ به اجراي جستجوي نزديك يابي مي پردازد. 7

                عملگرNEAR اجازه مي دهد كه دو واژه فاصله معيني از يكديگر داشته باشند و گاهي به جستجوگر اجازه مي دهند كه حداكثر فاصله را مشخص كند. براي مثال تقاضايInformation NEAR Science در موتورجستجوAlta Vista در نظر بگيريد. 10 اين تقاضا ركوردهايي را مي يابد كه حاوي هر دو واژه باشند و بيش از ده واژه از يكديگر فاصله نداشته باشند. 6 حال به تفاوت تعداد ركوردهاي بازيابي شده در تركيب كليدواژه هاي بالا توسط عملگرAND و عملگرNEAR روي نمودار شماره7 توجه كنيد تا به اهميت استفاده از آن پي ببريد.

  

 

 

 

 

 

 

 

 


 

1- Information AND Science ……269,000

2- Information NEAR Science …..260,000

 

           

با وجود اهميتي كه اين عملگر دارد ظاهراً ابزارهاي كاوش اصلي آن طور كه بايد و شايد آن را مورد توجه قرار نداده اند. به طوري كه تنها موتور كاوشAlta Vista وAOL امكان استفاده از عملگر نزديك يابي را در اختيار كاوشگران گذاشته اند. 4

موتور كاوشAOL مدعي است كه با بكارگيري عملگرADJ مي توان كليدواژه هاي مورد نظر را با همان ترتيبي كه وارد كادر جستجو شده اند در كنار هم بازيابي كرد. به عبارت ديگر اگر يك كليدواژه در سمت چپ عملگرADJ و ديگري در سمت راست آن قرار گيرد اين ترتيب در نتايج بازيابي شده دقيقاً اعمال خواهد شد همچنين موتور كاوشAOL امكان استفاده از عملگرNEAR را هم ارائه مي دهد و مدعي است كه مي توان از طريق اين عملگر تعداد كلمات واسط ميان دو كليدواژه مورد نظر را تعيين كرد. البته گاهي اوقات آمار بدست آمده از بازيابي صفحات باعث مي شود كه نتوان تكيه چنداني به اين قابليت كرد. 4

براي مثال تركيب كليدواژه هاي Science و Library را همراه با تعيين تعداد كلمات واسط ميان آن ها در موتور كاوش AOL روي نمودار شماره8 نشان داده شده است.

 

 

 

 

1- Science NEAR Library ………26,900

2- Science NEAR/1 Library …… 25,800

3- Science NEAR/2 Library …… 25,200

4- Science NEAR/3 Library …… 23,500

           

 

همان طور كه ملاحظه مي فرماييد با وجود اينكه بايد با افزايش  فاصله ي بين كلمات تعداد صفحات بازيابي شده نيز افزايش يابد ولي در مواردي تعداد نتايج جستجوي بدست آمده كاهش يافته است كه اين پديده برخلاف اصول و عملكرد اين قابليت است و اين ضعفي است كه متاسفانه در موارد بسياري از كاوش هاي انجام شده ديده مي شود.

 

 

پرانتزها و جستجو هاي تركيبي[9]

 

            برخي موتورهاي جستجو اين امكان را فراهم مي كنند كه با استفاده از پرانتزها و گروه بندي جملاتNEAR ،NOT ،OR ، ANDو جستجوهاي پيچيده تري انجام دهيد. 5 در واقع استفاده از پرانتزها باعث مي شود كه جملات پيچيده ي جستجو همان طور كه خواسته شده، پردازش شوند نه به آن ترتيبي كه در پيش فرض سيستم براي اجراي عملگرها به كار گرفته شده است. 6

               براي مثال وقتي شما عملگرهاي AND و OR  را در جملهCulture AND Iran OR Iranian بدون استفاده از پرانتز بكار مي بريد عملگرOR بايد قبل ازAND  پردازش شود ولي با اين وجود كامپيوترها يا به عبارتي موتورهاي كاوش اين طور تفسير نمي كنند و اجراي عملگرAND قبل ازOR قرار مي گيرد. بنابراين با توجه به اين كه هر موتور جستجو، قواعدي خاص خود براي نظم بخشيدن به ترتيب عملگرها دارد بهتر است در جستجوهاي پيچيده از پرانتزها كمك بگيريم. 2 و 5

               البته استفاده از پرانتز ارزش واقعي خود را هنگامي نشان مي دهد كه بخواهيد مجموعه هاي جداگانه اي از كليدواژه هاي مترادف را كه از طريق عملگر با يكديگر مرتبط شده اند توسط عملگرهاي يا با يكديگر تركيب كنيم. 4

               نكاتي را كه بايد  در جستجوي تركيبي مد نظر داشته باشيد  عبارتند از اين كه قبل از استفاده از جستجوي تركيبي توصيه مي شود از پرانتزها در جستجوي خود فقط در موارد لزوم و حتي الامكان كمتر استفاده كنيد و همچنين بهتر است توجه خود را روي يافتن واژه هاي كليدي مناسب و منحصر به فرد متمركز كرده و سعي كنيد با تركيبات ساده اي از جستجوها كار را ادامه دهيد. 5

               براي آشنايي با چگونگي استفاده از اين امكان مي توانيد به مثال زير توجه كنيد:

(Iran OR Persian OR Iranian) AND (Culture NOT Islam)

               لازم به ذكر است كه برخي از ابزارهاي كاوش از طريق كادرهاي جستجوي[10] جداگانه، امكان جستجوي تركيبي را در اختيار قرار مي دهند به اين ترتيب كه بايد كليدواژه ها را در كادرهاي جستجو وارد كرد و عملگر مورد نظر را از فهرست انتخاب برگزيد. 4

 

 

جستجو از طريق عملگرهاي رياضي[11]

 

               عملگرهاي رياضي يا عملگرهاي تلويحي بول[12] عبارتند از عملگرهاي + و -  و به ترتيب نقش عملگرهاي AND و NOT را در بازيابي اطلاعات ايفا مي كند. اين عملگرها به دليل سهولت نوشتن و بخاطرسپاري و نيز جلوگيري از ناهماهنگي در درج عملگرهاي بولي مورد استفاده قرار گرفته اند. قابل ذكر است در اين ميان هيچگونه عملگر رياضي خاصي براي ديگر عملگرهاي بولين پيش بيني نشده است. البته دربعضي از موتورهاي كاوش چنانچه از اين دو عملگر رياضي در ميان كليدواژه ها استفاده نشود موتور كاوش رابطه ميان آن كليدواژه ها را به شكل يا در نظر مي گيرد. 4

               جهت مقايسه توانايي ارائه عملگرهاي رياضي و جستجوي عبارتي توسط موتوركاوش هاي مختلف مي توانيد به جدول شماره2 در پيوستي كه در انتهاي تحقيق ارائه  شده است مراجعه فرماييد.

عملگر رياضي +:  تقريباً تمامي ابزارهاي كاوش، از طريق علامت مثبت (+)، كليدواژه هاي مختلف موردنظر كاربر را مشابه استفاده از عملگر AND تركيب كرده[13] و به اين ترتيب ركوردهايي بازيابي مي شوند كه شامل كليدواژه هاي موردنظر باشند. تفاوت استفاده از اين عملگر به اين صورت است كه بايد علامت + را قبل از كلمات يا عباراتي كه مي خواهيم در كاوش موجود باشند بياوريم. 4 و 11

               براي مثال تركيب كليدواژه هاي Internet و Boolean Search از طريق عملگر رياضي + به صورت زير انجام مي پذيرد:

+Internet  +Boolean Search

               همان طور كه ملاحظه مي كنيد بايد در ميان كليدواژه هاي تركيبي خود از طريق عملگرهاي رياضي، حتماً فاصله قرار دهيد زيرا در غير اين صورت در برخي موارد به نتايجي كاملاً متفاوت دست خواهيد يافت به صورتي كه ممكن است بسياري از اطلاعات مفيد بازيابي نشوند. 4نكته اي كه بار ديگر متذكر مي شويم مشابه بودن عملگر رياضي + با عملگر AND است. در واقع كارايي اين عملگرها تقريبا[14]ً در تمامي موتورهاي كاوش يكسان است.

عملگر رياضي :                كاربرد استفاده از علامت منفي (-) به عنوان عملگر رياضي تقريباً در تمامي موتورهاي كاوش مشابه عملگر  NOTاست و در واقع به يك معنا به كار برده مي شوند. نحوه ي استفاده از اين عملگر به اين صورت است كه علامت را قبل از كليدواژه يا عبارت موردنظر خود كه مي خواهيم از نتايج كاوش حذف شوند مي آوريم. 11

            براي مثال تفاوت بكارگيري  NOTو را در تركيب كليدواژه هاي  Internetو Information Science به صورت زير اعمال مي كنيم:

Information Science  -Internet

Information Science NOT Internet

               در واقع ركوردهايي كه از تركيب كليدواژه هاي بالا بدست مي آيد چه با استفاده از عملگر چه با بكارگيري عملگر NOT تقريباً يكسان مي باشد.[15]

               همان طور كه ملاحظه مي فرماييد همچون استفاده از عملگر رياضي + بعد از وارد كردن كليدواژه اول حتماً بايد يك فاصله قرار داده و سپس علامت را وارد كنيم. اما تفاوتي كه بين استفاده از عملگر رياضي + و است و حتماً به آن توجه كرده ايد اين است كه در مورد استفاده از عملگر ،علامت را فقط بايد قبل از كليدواژه يا عبارتي كه مي خواهيم در صفحات بازيابي شده وجود نداشته باشند قرار مي دهيم. 4

 

 

جستجوي عبارتي[16]

               

بسياري از موتورهاي جستجو، اين امكان را براي جستجوگر فراهم مي آورند كه به جاي كلمات انفرادي، عبارات را وارد كنند و به اين ترتيب كاربر مي تواند يك عبارت يا يك جمله مورد نظر خود را به همان ترتيبي كه مورد نظراش است و وارد كادر جستجو مي كند در صفحات بازيابي شده بدست آورد. براي استفاده از اين روش عبارت مورد نظر بايد در ميان علامت گيومه (" ") قرار گيرد. 4

                براي مثال چنانچه شما مي خواهيد اطلاعاتي در مورد Internet Search Engines بدست آوريد بايد آن را در ميان علامت گيومه قرار داده و وارد كادر جستجو كنيد.

"Internet Search Engines"

               

البته لازم به ذكر است كه استفاده از اين مورد بايد با دقت همراه باشد. چنانچه شما علامت گيومه را وارد نكنيد ممكن است موتورهاي جستجو با اين شرح جستجو مانند يك جمله بولي عمل كنند و عملگرها را به طور خودكار بوجود آورند. براي مثال برخي موتورهاي جستجو آن را به صورت جمله Internet AND Search AND Engines مورد بررسي قرار مي دهد و برخي ديگر آن را به منزله استفاده از  ORدر بين كلمات قرار مي دهند و به اين ترتيب ممكن است اطلاعاتي بازيابي شود كه زائد بوده و هرگز مورد استفاده شما نباشند. 4

كاربرد اساسي كه جستجوي عبارتي دارد در بازيابي اسامي خاص نظير نام سازمان ها نشريات اسامي افراد و ...، همچنين سوالات موردنظر خود را كه مي خواهيد دقيقاً به همان شكلي كه نوشته مي شوند بازيابي شوند مي توان مشاهده نمود. براي مثال به موارد زير توجه كنيد:

"World Health Organization"

"How Search Engines Work?"

 

قابل ذكر است كه در بخش جستجوي ساده يا پيشرفته اكثر ابزارهاي كاوش اصلي، گزينه هاي ديگري چون Exact Phrase يا  Exact Wordبراي اجراي جستجوي عبارتي پيش بيني شده است كه كاربران مي توانند از آن ها به عنوان جايگزين استفاده كنند. 5

شكل شماره 4. تصويري از صفحه جستجوي پيشرفته موتوركاوش Fast Search(alltheweb)  و گزينه the exact phrase كه جهت اجراي جستجوي عبارتي از آن استفاده مي شود.

           

در انتها نكته اي كه قابل ذكر است اين است كه با وجود استفاده از اين روش با اين حال سعي كنيد در برخي موارد كه لزوم چنداني بر وجود يك عبارت خاص و منحصر بفرد نيست و يا احتمال مي دهيد عبارت مورد نظرتان به شيوه ي ديگري هم ارائه مي شود شيوه ي تنظيم عبارت مورد نظر خود را تغيير دهيد تا مبادا اطلاعاتي مفيد و مرتبط از بين بروند. 5

 

 

استفاده از کليدواژه ها در جستجو

               

در بسياري از موارد جستجوها خود كليدواژه ها هستند كه نقش موثر و اساسي را بازي مي كنند و در واقع لازم است كه در اينگونه موارد كاوشگر دقت لازم در انتخاب كليدواژه مورد نظرش را بكار ببرد يا به عبارت ديگر بايد بداند كه دقيقاً به دنبال چه چيزي مي باشد. در اين قسمت به سه مورد خاص و البته با اهميت جستجو كه در آن ها نقش اصلي را كاربرد صحيح كليدواژه ها دارند ذكر شده است.

جهت مقايسه توانايي ارائه قابليت هاي استفاده از كليدواژه ها در جستجو در موتور كاوش هاي مختلف مي توانيد به جدول شماره3 در پيوست مراجعه فرماييد.

کوتاه سازي کليدواژه ها:                چون کليدواژه ها در رايانه ها حرف به حرف (نويسه به نويسه ) مقايسه مي شوند و بسياري از کليدواژه ها ريشه هاي مشترک دارند، گاه در جريان جستجو، فقط انطباق ريشه يا بخشي از يک عبارت براي بازيابي کافي است. از اين شيوه براي بازيابي صورت هاي مفرد و جمع کليدواژه هايي که بخش پاياني آن ها متفاوت است، استفاده مي شود. 1

علائمي که براي قطع کليدواژه ها يا به عبارت ديگر بريده سازي[17] آن ها به کار گرفته مي شود در نظام هاي مختلف متفاوت است. در برخي از علامت ستاره (*)، در برخي از علامت سئوال (?) و در برخي از علامت دلار ($) و يا از علامت هايي چون !، +، ، استفاده مي شود. با قرار دادن علامت اختصاص يافته براي قطع کلمات، مثلاً، علامت($) در مقابل کلمه Computer به صورت Computer$ مدارکي که کليدواژه هاي موضوعي آن ها Computers ، Computer و Computerized است بازيابي مي شوند. 1

نکته ي مهم در استفاده از عملگر کوتاه سازي، مکاني است که عملگر کوتاه سازي بايد به کار رود. بايد دقت داشته باشيم که عملگر کوتاه سازي را بعد از حرفي به کار ببريم که تا آنجا با ديگر مشتقات، مشابهت دارد. بنابراين ريشه کلمه مورد نظر را نوشته علامت مربوط به کوتاه سازي را بعد از آن قرار مي دهيم، بدين ترتيب، جستجوي واژه هايي که به پسوند هاي گوناگوني ( مثل _only، _ed،_ ing،_s ، _ness،  ful_ و غيره) ختم مي شوند آسان مي گردد. يعني به طور خودکار مجموعه اي از واژه هاي مرکب مرتبط به هم انتخاب مي گردند. 10

 چنانچه دقت کرده باشيد، استفاده از اين عملگر منجر به بازيابي تعداد بيشتري از صفحات وب مي شود. براي مثال شما مي توانيد نتيجه ي جستجوي جداگانه کليدواژه هاي search و searches و استفاده از عملگر کوتاه سازي search را در موتور کاوش Alta vista روي نمودار شماره10 مشاهده کنيد:

 

 

1- Search……..3,380,

2- Searches……181

3- Search*……3,510

 

 

در واقع يکي از محدوديت هاي استفاده از عملگر کوتاه سازي اين است که در برخي موارد ممکن است منجر به ريزش کاذب يا به تعبير ديگر بازيابي اطلاعات ناخواسته يا غير مرتبط شود.3 بنابراين، بايد از عملگر کوتاه سازي با دقت نظر و شناخت ريشه اصلي کلمات و مشتقات آن ها استفاده کرد.

                در مورد استفاده از علامت هاي ويژه کوتاه سازي بايد گفت که تقريباً هيچ يک از ابزارهاي کاوش اصلي، استفاده از اين عملگر در ابتداي کلمات را ارائه نمي دهند. اما برخي ابزارهاي کاوش نظير Alta vista و Northern Light امکان استفاده از عملگر کوتاه سازي در وسط کلمات را پيش بيني کرده اند. اين شيوه را که Wild card مي نامند در کليدواژه ي مورد جستجو مي تواند جايگزين يک يا چند حرف شود (نظير psych*ist به منظور پوشش کلمات نظير Psychiatrist و Psychologist ).2 و4

قابل ذکر است که در ميان ابزارهاي کاوش اصلي، تنها موتورکاوش Northern Light امکان کوتاه سازي تنها يک حرف را از طريق علامت در صد (%) ارائه مي کند. استفاده از قابليت کوتاه سازي تنها يک حرف هنگامي اهميت پيدا مي کند که کليدواژه هاي مورد نظر فقط در يک حرف در املاي امريکايي و انگليسي تفاوت داشته باشند، مثل: organization و Organisation4

 

جستجوي کليد واژه ها در نشاني صفحات وب[18]: در اغلب موتورهاي کاوش اصلي، قابليتي براي جستجوي کليد واژه ها در نشاني صفحات وب (URL) پيش بيني شده است.11 براي مثال، فرض کنيد در نظر داريد کليد صفحات وبي را که در نشاني دسترسي آنها کليد واژه Ahmadi nezhad : URL است. بدين ترتيب، صفحات وبي بازيابي خواهند شد که اين کليد واژه در نشاني دسترسي آنها به کار رفته است:4

www.iran_press_service.com/ips/articles_2005/ahmadi_nezhad

www.lawschoolblog.org/2005/12/ahmadi_nezhad

www.iran _press_service.com/ips/july_2005/ahmadi_nezhad

 

موتورهاي کاوش Alta vista و Google به ترتيب از دستورات:  url و :  inurlبراي اجراي اين نوع جستجو استفاده مي کنند. برخي ديگر از ابزارهاي کاوش براي اجراي اين امکان جستجو، فهرست انتخاب يا کادر هاي جستجوي جداگانه اي دارند. در بخش جستجوي پيشرفته ي موتور کاوش Northern Light امکانات بسيار خوبي براي جستجوي کليد واژه هاي مختلف در نشاني صفحاب وب از طريق عملگرهاي  AND، OR و NOT پيش بيني شده است. براي مثال شما مي توانيد به صورت زير چند کليد واژه را ترکيب کنيد: 4

online library journals AND url: inform* OR lib*

قابل ذکر است که برخي از موتورهاي کاوش در بخش جستجوي پيشرفته موتور خود کادر جداگانه براي جستجوي کليد واژه ها در نشاني صفحات وب تحت عنوان Words in URL و... دارند: (شکل شماره5 ). 5

 

شكل شماره5.صفحه جستجوي پيشرفته متور كاوش AltaVista و گزينه By URL جهت جستجوي كليدواژه ها در نشاني صفحات وب

 

يکي از پيش فرض هايي که مي توان در رابطه با کاربرد جستجوي کليد واژه ها در صفحات وب مطرح ساخت، اين است که طراحان سايت هاي وب، اغلب هر صفحه وب را از طريق کلمات کليدي مرتبط با آن صفحه و به صورت موضوعي از نشاني صفحه اصلي اول متمايز مي کنند. بنابراين از طريق جستجوي کليدواژه ها در نشاني صفحات وب تا حدودي مي توان به صفحات مرتبط در زمينه موضوعي مورد نظر نيز دست يافت: 4 

                      نشاني صفحه اول سايت وب شبكه خبري                                                    cnnhttp://www.cnn.com

http://www.cnn.com/news                                                                           بخش مربوط به اخبار

http://www.cnn.com/news/specials/2006                               بخش مربوط به اخبار مهم در سال 2006

http://www.cnn.com/news/specials/2006/iran election                خبر مربوط به انتخابات در سال 2006

 

از اين رو، همواره به طراحان صفحات وب توصيه مي شود كه براي متمايز كردن صفحات فرعي از صفحه اول سايت خود، از كلمات كليدي مرتبط با محتواي آنها استفاده كنند. ولي متاسفانه،‌گاهي مشاهده مي شود كه در نشاني دسترسي صفحات فرعي از كلمات نامرتبط و نامفهومي استفاده مي شود كه همين امر مي تواند استفاده از قابليت جستجوي كليد واژه ها در نشاني صفحات وب و بازيابي اطلاعات مرتبط را دچار مشكل كند.4

چنانچه از اين ويژگي به درستي استفاده شود مشاهده خواهيد كرد كه باعث كاهش تعداد صفحات بازيابي شده و در نتيجه امكان دستيابي به اطلاعات مرتبط تر بيشتر است.11 اين تفاوت را مي توانيد در مثال زير و روي نمودار شماره11 ملاحظه فرماييد كه در موتور كاوش AltaVista انجام شده است:

 

 

1- url:ui…......1,470

2-ui…………21.500

جستجو كليد واژه در عنوان صفحات وب[19]: يكي از روش هاي دسترسي به اطلاعات در محيط وب، جستجوي كليدواژه ها در عنوان صفحات وب است. آنچه در اين زمينه مهم است اين است كه عنوان يك صفحه وب، تا حدود بسيار زيادي مي تواند نمايانگر محتواي اطلاعات موجود در آن باشد، بنابراين جستجوي كليدواژه هاي مختلف در عناوين صفحات وب مي تواند كاوشگران را به اطلاعات مرتبط در محيط وب هدايت كند.11

                تقريباً، همه ابزارهاي كاوش اصلي از طريق دستورات كاوش يا فهرست انتخاب، امكان جستجوي كليدواژه ها را در عنوان صفحات وب فراهم مي آورند. برخي از ابزارهاي كاوش، براي چنين جستجويي كادر جداگانه اي دارند.3  و5

                ابزارهاي كاوش براي جستجوي كليدواژه ها در عنوان صفحات وب، ممكن است دستورات و فرمان هاي كاوش متفاوتي را به كار ببرند،براي مثال :in the title of the page )در Google )و يا in the title: (درFast Search ). در اين ميان اغلب ابزارهاي كاوش اصلي از طريق فهرست انتخاب يا گزينه ها يي تحت عنوان words in title، the page title ، titles only و از اين قبيل، امكان جستجوي كليد واژه ها را در عنوان صفحات وب فراهم مي كنند (شكل شماره6 ). 4

 

شكل شماره6. صفحه جستجوي پيشرفته موتور كاوش Google و گزينه in the title of the page

 

جستجوي كليد واژه ها در عنوان صفحات وب به اين دليل حائز اهميت است كه از طريق آن مي توان دامنه ي جستجو را محدود و حجم كمتري از اطلاعات را بازيابي كرد.  گاهي تركيب قابليت جستجو ي عبارتي با جستجوي كليدواژه ها در عنوان صفحات وب، شيوه بسيار قدرتمند و موثري براي بازيابي اطلاعات مرتبط به شمار مي آيد.11

                براي مثال شما مي توانيد تفاوت نتيجه كاوش كليدواژه هايIran و Nuclear Power را در هر كجاي متن و همچنين در عنوان صفحات وب و در مرحله بعد به طور اخص تر در موتور كاوش Google روي نمودار شماره12 ملاحظه فرماييد.

  

 


 

             

 

1- Nuclear Power AND Iran……30,400

2- title: Nuclear Power AND Iran…634

3- title: “Nuclear Power AND Iran”..22

 

 

نتيجه گيري و بحث

               

همان طور كه قبلاً ذكر شد مسئله بازيابي اطلاعات مفيد و موثر همواره مورد توجه پژوهشگران و كاربران اينترنتي بوده است و در اين ميان رشد اهميت حياتي اطلاعات لزوم صرفه جويي در وقت و هزينه جستجوكنندگان جوان بودن شبكه هاي گسترده بخصوص از لحاظ سرعت لزوم دستيابي سريع جامع و مانع به اطلاعات خاص مورد نياز از جمله مسايل مهمي هستند كه اهميت يك فرايند بازيابي حساب شده كنترل شده و كامل را آشكار مي سازند.6 بنابراين نكاتي را جهت جستجوي اطلاعات در محيط وب ارائه مي دهيم كه چنانچه آنگونه كه گفته شده است عمل گردد جستجوگران را تا حد زيادي در باز يابي اطلاعات مورد نظر ياري مي رساند:

1.       قبل از انتخاب موتور جستجوي مورد نظر در مورد راهبرد خود و اينكه چه روشي مفيدتر است فكر كنيد.

2.    تصميم بگيريد كه چه ويژگي ها و عملگرهايي مفيد هستند:    - منطق بولي؟       - پرانتزها؟  - همسايگي؟        - اختصار؟        - جستجوي عبارتي؟       - ... ؟

3.      مشخص كنيد كه چه موتورهاي جستجويي اين ويژگي ها را ارائه مي كنند.

4.      از جستجوي ويژه استفاده كنيد و در صورت لزوم نيزآن را وسعت ببخشيد. نتايج جستجو را بررسي كرده راهبرد خود را تغيير دهيد.

5.      در استفاده از چندين موتور جستجو و روش هاي مختلف شك نكنيد.

6.    حداقل از دو موتور جستجو استفاده كنيد مگر اينكه موتور اول دقيقاً خواسته هاي شما را برآورده سازد. اگر مطلب يا صفحه خاصي را جستجو مي كنيد از چندين موتور كاوش استفاده كنيد تا آن را بيابيد يا به اين نتيجه برسيد كه فعلاً كافي است.10

7.    براي جستجو از طريق چند موتور جستجو همواره به ياد داشته باشيد كه اولاً هنگام استفاده از عملگرها حروف بزرگ را به كار ببريد زيرا براي هر موتوري كه از عملگرهاي بولي استفاده مي كند حروف بزرگ قابل فهم است. دوماً هنگام جستجوي اسامي حروف بزرگ و كوچك را رعايت كنيد.10

در نهايت بايد اين نكته را خاطر نشان كرد كه جستجوگران باتجربه و متخصصان بازيابي اين نكته را مي دانند كه جستجو مستلزم صرف وقت و هزينه است و در اين مسير بايد با اصلاح بازنويسي و تكرار چرخه جستجو به نتايج دلخواه دست يافت.در مورد موتور هاي كاوش هم به ياد داشته باشيد كه خدمات اين موتور ها هنوز در دوران جواني خود به سر مي برند. اين موتورها از نظر توانمندي و فكري در حال رشد هستند و دائماً در حال تغيير و تحول مي باشند. ضعف هاي كوچك را جدي نگيريد و از تغييرات مثبت استفاده كنيد. از ويژگي هاي جديد و بزرگ بهره مند شويد. موتور هاي جستجو قابليت هاي پژوهشي دارند و هر روز بهتر مي شوند. مطمئن باشيد شما را در دستيابي به نكات مورد نظرتان ياري مي كنند.10

 

 

 

 

 

 

 

 

 

 

 

پيوست

مقايسه موتوركاوش هاي متفاوت در ارائه عملگرها و قابليت هاي مختلف

 

 

جدول شماره 1-  ارزيابي عملگرهاي بولين و همجواري در موتور هاي كاوش مختلف

            عملگرها

موتور جستجو

AND

OR

NOT

استفاده از پرانتز

نزديك يابي

Fast Search

بلي

خير

خير

بلي

خير

Alta Vista

بلي

بلي

بلي

بلي

بلي

AOL

بلي

بلي

بلي

بلي

بلي

Google

بلي

بلي

بلي

خير

خير

Hot Bot

بلي

بلي

بلي

بلي

خير

Lycos

بلي

بلي

بلي

خير

خير

MSN

بلي

بلي

بلي

بلي

خير

Northern Light

بلي

بلي

بلي

بلي

خير

 

 

 

 

جدول شماره 2- ارزيابي عملگر هاي رياضي و جستجوي عبارتي در موتور هاي كاوش مختلف

             عملگرها

موتور جستجو

عملگر رياضي +

عملگر رياضي -

جستجوي عبارتي

Fast search

بلي

بلي

بلي

Alta Vista

بلي

بلي

بلي

AOL

بلي

بلي

بلي

Google

بلي

بلي

بلي

Hot Bot

بلي

بلي

بلي

Lycos

بلي

بلي

بلي

MSN

بلي

بلي

بلي

Northern Light

بلي

بلي

بلي

 

 

 

 

جدول شماره 3- ارزيابي فيلدهاي عنوان و URL و قابليت هاي كوتاه نويسي در موتورهاي كاوش مختلف

      قابليت

 

موتوركاوش

عنوان

URL

اختصار انتهاي واژه

اختصار ابتداي واژه

اختصار وسط واژه

جايگزيني يك حرف

استفاده از دو اختصار

Fast Search

بلي

بلي

بلي

خير

بلي

خير

خير

AltaVista

بلي

بلي

بلي

خير

خير

خير

خير

AOL

خير

خير

بلي

خير

بلي

خير

خير

Google

بلي

بلي

خير

خير

خير

خير

خير

Hot Bot

بلي

خير

بلي

بلي

خير

خير

خير

Lycos

بلي

بلي

خير

خير

خير

خير

خير

MSN

بلي

خير

بلي

خير

خير

خير

خير

Northern Light

بلي

بلي

بلي

خير

بلي

بلي

بلي

 

نكته نهم و قابل توجه اينكه شما مي توانيد با مراجعه به ابر موتور سرچ (mywebsearch) در سه موتور سرچ   ياهو - گوگل - اسك كام  به جستجوي همزمان بپردازيد.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

فهرست مآخذ

 

1.  دياني، محمد حسين؛ داور پناه، محمد رضا. مفاهيم و روشهاي ذخيره و بازيابي اطلاعات در نظامهاي       كامپيوتري كتابخانه هاي ايران. مشهد: دانشگاه فردوسي مشهد، موسسه چاپ و انتشارات، 1378.

2.    شركت مهندسي رز سيستم. راهنماي استفاده از شبكه اطلاع رساني علمي، صنعتي و تجاري ايران Rose-Net User Manual (ويرايش پزشكي). تهران: زمان، 1380.

3.    فرزانه، فاطمه، ترجمه و تدوين. تكنيك ها و ابزارهاي جستجو در اينترنت. تهران: ناقوس: ميرزايي، 1384.

4.    كوشا، كيوان. ابزارهاي كاوش اينترنت: اصول، مهارتها و امكانات جستجو در وب. نشر كتابدار؛ 21. فناوري اطلاعات؛ 3. تهران: نشر كتابدار، 1381.

5.    گلاسبرنر، آلفرد؛ گلاسبرنر، اميلي. كليد طلايي جستجو در اينترنت. ترجمه رضا مجري، ليلا ملكان، عبدالله تباره. تهران: انتشارات خليج فارس، 1382.

6.  لارج، آندرو؛ تد، لوسي؛ و هارتلي، ريچارد. جستجوي اطلاعات در عصر اطلاعات: اصول و مهارت ها. تهران: كتابدار، 1382.

7.    منتظر، غلامعلي. موتورهاي كاوش اينترنت: درآمدي بر بازيابي بهينه اطلاعات. تهران: كوير، 1382.

8.    ميلنر، آناليزا. سير در اينترنت. ترجمه محمد رضا ركن الديني. تهران: قدياني، 1381.

9.    هارتلي، آر. ج.، و ديگران. اصول و روشهاي جستجوي پيوسته. مشهد: كتابخانه رايانه اي، 1381.

10. هوك، رندولف. جست و جو در اينترنت. ترجمه عين الله جعفرنژاد قمي.بابل:علوم رايانه، 1381.

11. يوسفي، احمد" ارزيابي و تحليلي بر ازارهاي كاوش در اينترنت"، در سمينار انجمن كتابداري و اطلاع رساني ايران(26تيرماه 1381)، مجموعه مقالات همايش هاي انجمن كتابداري و اطلاع رساني ايران. انجمن كتابداري و اطلاع رساني ايران؛ 2. تهران: انجمن كتابداري و اطلاع رساني ايران: سازمان اسناد و كتابخانه ملي جمهوري اسلامي ايران، 1384.

 


 

[1] . Alan Emtage

[2] . Matthew Gray

[3].  Wandex

[4]. Marchionini

[5] .http:// searchenginewatch.com

[6] .Subject Directory

[7] . Uniform Resource Locator

[8] .Boolean Search

[9] .Compound Search_ Nesting

[10] .Search boxes

[11] .Math Operators

[12] .Implied Boolean

[13] .راهنماي موضوعي Look Smart و موتوركاوش Google امكان استفاده از اين عملگر را ندارند.

[14] .اين نكته را متذكر مي شويم كه در مواردي اختلاف هايي در بازيابي ركورد ها ملاحظه مي شود كه باعث مي گردد نتوان قيد كاملاً يكسان را در اين مورد به كار برد.

[15] .قابل ذكر است استفاده از عملگرهاي رياضي و بول در اغلب موتورهاي كاوش يكسان است مگر در مواردي خاص همچون  Fast Search و...

[16] . Phrase Search

[17] .Truncation

[18] . Words in URL

[19] . Keywords in Title