ترفندهای گوگل – قسمت اول
* به طور کلی دو نوع از موتورهای جستجو موجود است. در اولین نوع که فهرست موضوعی قابل جستجو نامیده می شوند مانند !Yahoo، تنها عناوین و توصیفات سایت ها جستجو می شود. نوع دوم یا موتورهای جستجوی full-text ازعنکوبتهای کامپیوتری شده برای فهرست بندی میلیون ها و بعضی مواقع بیلیون ها صفحه استفاده می کنند. این صفحات با عنوان و محتوا جستجو می شوند. گوگل یک موتور جستجوی full-text است.
* هر وقت شما از بیش از یک کلمه برای جستجو استفاده می کنید، موتور جستجو دارای روش پیش فرضی برای مدیریت این کلمات است. این روش پیش فرض، پیش فرض Boolean است، که این نوع بولین می تواند AND یا OR باشد....
- پیش فرض بولین گوگل AND است؛ به این معنا که اگر عبارات را بدون modifier ها وارد کنید، گوگل همه آن ها را جستجو خواهد کرد:
snowblower Honda “Green Bay”
- اگر می خواهید مشخص کنید “این کلمه یا آن کلمه مورد قبول است”، بین هر کلمه یک OR قرار دهید:
snowblower OR snowmobile OR “Green Bay”
- اگر می خواهید قطعا یک عبارت به همراه یکی از دو یا چند عبارت دیگر داشته باشید، به کمک پرانتز آنها را گروه بندی کنید:
snowblower (snowmobile OR “Green Bay”)
- به جای OR می تونید از کاراکتر pipe “|” استفاده کنید:
snowblower (snowmobile | “Green Bay”)
- اگر می خواهید یک کلمه در نتیجه جستجو ظاهر نشود از کاراکتر dash “-” استفاده کنید.
snowblower snowmobile -”Green Bay”
- در این صورت صفحاتی که شامل کلمات “snowblower” و “snowmobile” هستند، اما شامل عبارت “Green Bay” نیستند، جستجو می شوند.
* دکمه “یا بخت و یا اقبال” یکی از ویژگی های جالب گوگل می باشد. به جای نشان دادن لیستی از نتایج جستجو، شما به مناست ترین سایتی که گوگل اعتقاد دارد به جستجوی شما مربوط است هدایت می شوید. تلاش برای جستجوی کلمه “president” شما را به سایت http://www.whitehouse.gov می برد.
* بعضی از موتورهای جستجو نسبت به بزرگ یا کوچک بودن حرف حساس هستند (case sensitive). گوگل case sensitive نیست. اگر شما کلمات Three، three یا THREE را جستجو کنید، نتایج یکسانی حاصل می شود.
* گوگل بیشتر از 10 کلمه را در یک کوئری، شامل ترکیبات خاص، قبول نمی کند.
* گوگل از stemming یا توانایی استفاده از نشان ستاره * در قسمتی از یک کلمه پشتیبانی نمی کند. برای مثال، *moon در یک موتور جستجو که از stemming پشتیبانی می کند، کلمات “moonlight”، “moonshot”، “moonshadow” و … جستجو می شوند. هر چند گوگل نشان ستاره را به عنوان جایگزین یک کلمه کامل قبول می کند. جستجو برای عبارت “three * mice” در گوگل، “three blind mice”، “three blue mice” و … را پیدا خواهد کرد.
قسمت دوم
علاوه بر AND، OR و رشته های نقل قولی (quoted strings) ، گوگل ترکیبات خاص دیگری برای هر چه بهتر کردن جستجوی شما ارائه می دهد.
گوگل یک موتور جستجوی full-text است، بنابراین تمامی یک صفحه وب را فهرست بندی می کند. ترکیبات خاص به کاربران گوگل این امکان را می دهند تا قسمتهای مختلف و یا نوع خاصی از اطلاعات را جستجو کنند. این مسئله وقتی که با 2 بیلیون صفحه وب مواجه می شوید مطرح است و شما به هر فرصتی برای کم کردن نتایج جستجو نیاز خواهید داشت. مشخص کردن این که کلمات کوئری شما تنها در عنوان و یا URL جستجو شود روشی مناسب برای کسب نتایج مورد نظر است، بدون اینکه به خاص بودن خود کلمات فکر کنید...
intitle
جستجوی شما را در عناوین صفحات وب منحصر می کند. با نوع allintitle: صفحاتی که در آنها همه کلمات مشخص شده عنوان صفحه وب را می سازند، پیدا می شوند. بهتر است از allintitle: استفاده نکنید، به این دلیل که به خوبی با بعضی از ترکیبات خاص دیگر، ترکیب نمی شود.
intitle:”george bush”
allintitle:”money supply” economics
inurl
جستجوی شما را در URLهای صفحات وب منحصر می کند. این ترکیب برای پیدا کردن صفحات help و search به خوبی کار می کند. نوع allinurl: تمامی کلمات لیست شده در یک URL را جستجو می کند، اما با بعضی از ترکیبات خاص دیگر، به خوبی ترکیب نمی شود.
inurl:help
allinurl:search help
intext
تنها متن body را جستجو می کند (از متن لینک ، URLها و عناوین صرفنظر می کند). نوع allintext: نیز وجود دارد اما مانند قبل، در ترکیب با بقیه نقش مناسبی ایفا نمی کند. در حالیکه استفاده از آن محدود است، استفاده از آن برای پیدا کردن کلماتی که ممکن است خیلی در URLها و لینک عناوین متداول باشند، مناسب است.
intext:”yahoo.com”
intext:html
inanchor
متن لینک انکر صفحه را جستجو می کند. لینک انکر، متن توصیفی یک لینک است. برای مثال، انکر لینک در کد O’Reilly and Associates، عبارت “O’Reilly and Associates” است.
inanchor:”tom peters”
site
این امکان را می دهد تا جستجوی خود را در یک سایت محدود کنید. AltaVista بری مثال، دو ترکیب برای این کار دارد (host: و domain:) اما گوگل تنها یک ترکیب دارد.
site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us
link
لیستی از صفحات لینک شده به صفحه مشخص شده را بر می گرداند. link:www.google.com را وارد کنید، لیستی از صفحاتی که به گوگل لینک شده اند را بر می گرداند. نگران استفاده از http:// نباشید؛ به نظر می رسد در صورت وارد کردن آن، گوگل از آن صرفنظر می کند. link: تنها با URLهای عمیق به خوبی کار می کند، مانند raelity.org به جای http://www.raelity.org/apps/blosxom.
قسمت سوم
cache
یک کپی از صفحه فهرست شده (indexed) توسط گوگل را پیدا می کند، حتی اگر این صفحه با آدرس اصلی قابل دستیابی نباشد و یا محتوای آن تغییر کرده باشد. این روش مخصوصا برای صفحاتی که مکررا تغییر می کنند مفید است.
cache:www.yahoo.com
daterange
جستجوی شما را به یک تاریخ خاص یا محدوده ای از تاریخ، که در آن یک صفحه فهرست بندی شده است منحصر می کند. ذکر این نکته مهم است که جستجوی شما وقتی که یک صفحه توسط گوگل فهرست می شود قابلیت محدود شدن دارد، نه زمانیکه صفحه ایجاد می شود. بنابراین وقتی که یک صفحه در 2 فوریه ایجاد می شود و تا 11 آوریل توسط گوگل فهرست نمی شود، با استفاده از daterange در 11 آوریل پیدا خواهد شد. به خاطر داشته باشید که گوگل صفحات را فهرست بندی مجدد می کند. تغییر محدوده تاریخ به تغییر محتوا وابسته است. برای مثال گوگل صفحه ای را در 1 ژوئن فهرست می کند، این صفحه دوباره در 13 آگوست فهرست می شود، اما محتوای آن تغییر نکرده است. تاریخ مورد جستجو با daterange هنوز 1 ژوئن خواهد بود.
daterange با تاریخ Julian کار می کند نه با تاریخ Gregorian (تاریخی که از آن استفاده می کنیم). مبدل های آنلاین برای تبدیل وجود دارد، اما اگر می خواهید بدون هیچ دردسر فقط با گوگل جستجو کنید، از واسط گوگل FaganFinder استفاده کنید....
“George Bush” daterange:2452389-2452389
neurosurgery daterange:2452389-2452389
filetype
پسوند فایل ها را جستجو می کند. معمولا، ولی نه لزوما، انواع متفاوتی از فایل ها وجود دارد. برای مثال جستجو برای filetype:htm و filetype:html تعداد نتایج متفاوتی خواهد داشت، اگرچه نوع فایل ها یکسان است. همچنین شما می توانید تولید کننده های صفحات متفاوت مانند: ASP , PHP , CGI و … را جستجو کنید. گوگل قالب های متفاوتی از مایکروسافت را نیز فهرست بندی می کند، شامل: PowerPoint (PPT) ، Excel (XLS) و Word (DOC).
homeschooling filetype:pdf
“leading economic indicators” filetype:ppt
related
صفحاتی که به صفحه مشخص شده مربوط هستند پیدا می کند. این روش مناسبی است تا دسته ای از صفحات را جستجو کنید؛ جستجو برای related:google.com موتورهای جستجوی گوناگونی را شامل HotBot ، Yahoo! و Northern Light را بر می گرداند.
related:www.yahoo.com
related:www.cnn.com
info
صفحه ای از لینکها برای اطلاعات بیشتر درباره URL مشخص شده فراهم می کند. این اطلاعات شامل: لینک به صفحه ذخیره شده URL ، یک لیست از صفحاتی که به آن URL لینک شده اند، صفحاتی که به URL مربوط هستند و صفحاتی که شامل آن URL هستند. به یاد داشته باشید که این اطلاعات به اینکه گوگل آن URL را فهرست بندی کرده باشد یا نه وابسته است. اگر گوگل URL را فهرست بندی نکرده باشد، بدیهی است که این اطلاعات محدود خواهند بود.
info:www.oreilly.com
info:www.nytimes.com/technology
phonebook
همانطور که انتظار دارید، شماره تلفن ها را جستجو می کند.
phonebook:John Doe CA
phonebook:(510) 555-1212
اگر به جای نوشتن بک خط کوئری به دنبال یک روش ساختار یافته و ویژوال هستید، جستجوی پیشرفته گوگل گزینه مناسبی است (اگرچه جستجوی پیشرفته گوگل تمام ترکیبات ذکر شده را به صورت ویژوال پشتیبانی نمی کند).
قسمت چهارم
ترکیب دستورات جستجو - Mixing Syntaxes
مواقعی وجود دارد که شما نمی توانید بعضی از دستورات خاص گوگل را با هم ترکیب کنید. در حالیکه بعضی از این دستورات قابل ترکیب نیستند، ترکیبات فراوان دیگری با روش های نیرومند و زیرکانه وجوددارد. یک ترکیب هوشمندانه می تواند به طرز شگفت انگیزی شما را به نتیجه دلخواهتان نزدیک کند.
1. دستورات غیر ترکیبی (The Antisocial Syntaxes)
این نوع از دستورات بایستی به صورت اختصاصی مورد استفاده قرار بگیرند. اگر شما تلاش کنید تا از آن ها به همراه دستورات دیگر استفاده کنید، هیج نتیجه ای نخواهید گرفت....
دستوراتی که اطلاعات خاصی را درخواست می کنند مانند stock: ، rphonebook: ، bphonebook: و phonebook: دستورات غیر ترکیبی هستند. شما نمی توانید آنها را ترکیب کنید و انتظار دریافت نتیجه ای را داشته باشید.
نوع دیگری از این دستورات، دستور link: است. این دستور صفحاتی که به URL مشخص شده لینک شده اند نشان می دهد. آیا بهتر نخواهد بود تا دومین هایی که می خواهید صفحات مورد نظر شما از آنجا باشد انتخاب کنید؟ متاسفانه این کار امکان پذیر نیست. دستور link: غیر قابل ترکیب است.
برای مثال شما می خواهید صفحاتی که به O’Reilly & Associates لینک شده اند پیدا کنید، اما نمی خواهید شامل صفحاتی از دومین .edu باشد. کوئری زیر کار نخواهد کرد، چون دستور link: به هیج وجه با بقیه قابل ترکیب نیست.
link:www.oreilly.com -site:edu
شما نتایجی دریافت خواهید کرد، اما با کوئری فوق متناسب نیست. برای حل این مشکل می توانید از روش زیر استفاده کنید:
inanchor:oreilly -inurl:oreilly -site:edu
اما این روش کاملا مناسب نیست. این کوئری تنها لینک هایی که شامل کلمه oreilly هستند را پیدا می کند. اگر شخصی لینکی مانند [a xhref=”http://perl.oreilly.com/” mce_href=”http://perl.oreilly.com/” ]Camel Book[/a] را ایجاد کند این لینک توسط کوئری فوق پیدا نخواهد شد. علاوه بر این، دومین های دیگری وجود دارند که شامل کلمه orielly هستند و شاید دومین هایی باشند که شامل کلمه orielly باشند اما orielly.com نباشند. می توان با حذف نتایج مربوط به خود سایت orielly.com اما نه سایت های دیگری که شامل کلمه orielly هستند به نتایجی رسید:
inanchor:oreilly -site:oreilly.com -site:edu
پس ترکیب ها چگونه اند؟ هر چیزی غیر از موارد فوق قابل ترکیب است، اما روش های درست (How to Mix Syntaxes) و نادرستی (How Not to Mix Syntaxes) برای انجام این کار وجود دارد. در قسمت های بعد این روش ها، شرح داده خواهند شد.
قسمت پنجم
ترکیبهای نادرست
1. دستوراتی که یکدیگر را نقض می کنند:
site:ucla.edu -inurl:ucla
2. استفاده مفرط از یک دستور:
site:com site:edu
به عنوان مثال کوئری perl site:edu site:com را در نظر بگیرید. این جستجو هیچ نتیجه ای را در بر نخواهد داشت. به این دلیل که صفحه پیدا شده نمی تواند در یک زمان از یک دامنه edu و یک دامنه com باشد. برای رفع این مشکل از کوئری زیر استفاده کنید:
perl (site:edu | site:com)
3. در زمان ترکیب دستورات از allinurl: و allintitle: استفاده نکنید. به جای آنها از inurl: و intitle: استفاده کنید. اگر بدرستی allinurl: را درجای مناسبی قرار دهید نتایج عجیبی را دریافت خواهید کرد:
allinurl:perl intitle:programming
در اولین نگاه به نظر می رسد شما در جستجوی کلمه perl در URL نتیجه و کلمه programming در عنوان هستید. حق با شماست، این کوئری به خوبی کار می کند. اما چه اتفاقی می افتد اگر شما allinurl: را به سمت راست انتقال دهید؟
intitle:programming allinurl:perl
به هیچ نتیجه ای نخواهید رسید. استفاده از این دستورات به این که در چه مکانی آنها را قرار می دهید وابسته است.
4. از دستورات زیاد برای اینکه خیلی به نتیجه نزدیک شوید استفاده نکنید:
title:agriculture site:ucla.edu inurl:search
اگر به دنبال چیزی هستید که خیلی مشخص است و فکر می کنید به یک کوئری محدود نیاز دارید، هر بار با ساختن یک کوئری کوچکتر شروع کنید. فرض کنید به دنبال plant databases در UCLA هستید. به جای شروع با این کوئری:
title:plants site:ucla.edu inurl:database
چیزهای ساده تر را امتحان کنید:
databases plants site:ucla.edu
سپس سعی کنید به کلمات کلیدی که هم اکنون در نتایج جستجو محرز شده اند دستوراتی را اضافه کنید:
intitle:plants databases site:ucla.edu
یا:
intitle:database plants site:ucla.edu
ترکیب های درست
اگر شما سعی می کنید تا نتایج جستجو را محدود کنید، دستورات intitle: و site: بهترین شانس برای شما هستند.
- عناوین و سایت ها
به عنوان مثال شما می خواهید از اینکه چه پایگاه داده هایی توسط ایالت Texas ارائه شده اند، آگاهی داشته باشید. این جستجو را اجرا کنید:
intitle:search intitle:records site:tx.us
با اضافه کردن کلمات کلیدی بیشتر، جستجوی خود را محدودتر خواهید کرد:
birth intitle:search intitle:records site:tx.us
این که کلمات کلیدی معمولی را (مانند birth) در شروع یا پایان جستجو قرار دهید اهمیتی ندارد.
دستور site: برخلاف موتورهای جستجوی دیگر، این امکان را می دهد به صورت کلی، پسوند domain (site:com) ، domain خاص و یا subdomain ها را (site:thomas.loc.gov)جستجو کنید:
intitle:records site:el-paso.tx.us
- عناوین و URL
بعضی از مواقع شما به دنبال نوع خاصی از اطلاعات هستید، اما نمی خواهید جستجوی شما بر اساس نوع اطلاعات محدود شود. در عوض آیا می خواهید جستجو بر اساس موضوع اطلاعات محدود شود؟ شما یک راهنما یا موتور جستجو می خواهید. به عیارت دیگر شما به جستجو در URL نیاز دارید.
دستور inurl: یک عبارت را در URL جستجو می کند، اما یافته های مربوط به URL های بزرگتر را به حساب نمی آورد. به عنوان مثال inurl:research را جستجو کنید، گوگل صفحات مربوط به researchbuzz.com را پیدا نمی کند، اما صفحاتی از www.research-councils.ac.uk را پیدا خواهد کرد.
فرض کنید بدنبال اطلاعاتی در زمینه بیولوژی هستید، با تاکید بر آموزش و دستیاری:
intitle:biology inurl:help
برای اینکه جستجو را محدودتر کنید، می توانید تنها در سایت دانشگاهها جستجو کنید:
intitle:biology inurl:help site:edu
اما مراقب استفاده دستورات باشید، ممکن است با زیاد بودن آنها هیچ نتیجه ای را دریافت نکنید.
- همه احتمالات
آزمایش. آزمایش بیشتر. به یاد داشته باشید که بیشتر این ترکیبات مستقل نیستند، و شما می توانید ترکیبات تازه تری با ترکیب یکی یکی آن ها به دست آورید.
نوشته شده توسط MoH3N






|
نوشته شده در پنجشنبه هجدهم تیر 1388 |
نوشته شده توسط محسن