ساختار URLهای وب‌سایت

در این مقاله در مورد ساختار URL صحبت خواهد شد و راهکارهایی تجربی و علمی در مورد استانداردسازی و نظم دهی به محتوای وب سایت ارائه خواهد شد.

در این مقاله سعی دارم با بررسی فاکتورهایی مانند URL و BreadCrumb به استانداردی برای ساختار و معماری صفحات و بخش‌های مختلف یک وب‌سایت برسم.

ابتدا به تعریفی از هر کدام از موارد می‌پردازم، سپس تجربیات و راهکارهایی که در سال‌های مختلف به آن رسیده‌ام را با شما به اشتراک می‌گذارم.

منظور از URL چیست؟

URL مخفف عبارت Uniform Resource Locator است که به آن نشانی وب هم گفته می‌شود و به طور خلاصه به معنی آدرس کامل یک صفحه و یا یک فایل درون اینترنت است.

احتمالاً در بعضی از نرم‌افزارها مانند وردپرس شما با کلماتی مانند نامک، Permalinks و Slug نیز روبرو خواهید شد که تاحدودی به معنای آدرس یک صفحه است.

Breadcrumb چیست؟

اگر به بالای صفحات وب‌سایت‌های معتبر و معروف با دقت نگاهی بیندازید متوجه خواهید شد که چند لینک از صفحات قبلی وب‌سایت در آنجا قرار دارد که به کاربر کمک می‌کند تا بتواند مسیر خود را در وب‌سایت پیدا کند.

تصویری از ‌BreadCrumbs وب سایت دیجی کالا که میتواند کمک به استاندارد سازی وب سایت و ساختار URL وب سایت کند.

Bread Crumb در لغت به معنای نان خشک است و تداعی کننده داستان هانسل و گرتل است که در آن نامادری دو کودک آن‌ها را در جنگل رها می‌کند و آن‌ها به کمک خورده‌های نان راه خود را پیدا می‌کنند.

به گوگل بفهمونید چی به چیه؟

بیایید با هم یک داستان ساده را بخوانیم.

یک روز دکتری به تیمارستانی سر میزنه تا اوضاع اونجا رو بررسی کنه …
در بین دیوانه‌ها مردی رو میبینه که به نظرش خیلی سالم و عادی میاد.
اونو پیش خودش صدا می‌کنه و ازش می‌پرسه:
شما رو برای چی آوردن تیمارستان؟

مرد جواب میده:
آقای دکتر، من با خانمی ازدواج کردم یک یک دختر ۱۸ ساله داشت.
یک روز پدرم از این دختر خوشش میاد با اون ازدواج می‌کنه.
از اون روز دیگه زن من، میشه، مادر زن پدر شوهر خودش.
چند وقت بعد، دختر زن بنده که میشد زن پدرم، یک پسر به دنیا می‌آره.
این پسر از یک طرف میشد برادر من، چون پسر پدرم بوده و از طرف دیگه چون نوه زنم هم بوده، نوه من هم میشده.

با این اوصاف من پدربزرگ برادر ناتنی خودم بودم.
چند وقت بعد، زن من هم یه پسر به دنیا میاره.
از اون روز، زن پدرم شد، خواهر ناتنی پسرم و مادربزرگ اون، در صورتیکه پسرم برادر مادربزرگ خودش و نوه اون هم بود.
از طرف دیگه چون مادر فعلی من، یعنی دختر زنم، میشده خواهر پسرم، بنده هم ظاهرا میشم خواهر زاده پسر خودم!

در ضمن باید خدمتتون عرض کنم که من پدر مادرم و پدربزرگ خودم هم هستم و پسر پدرم هم برادر و هم نوه منه!
آقای دکتر، اگه شما جای من بودید، کارتون به تیمارستان نمی‌کشید؟

اگر خودتان را بجای گوگل بگذارید که وارد سایت‌هایی شده است که سر و ته صفحات و لینک سازی ها  و محتوایی که ایجاد میکنند نامشخص است، احتمالاً این داستان برای شما خیلی آشنا خواهد بود.

یکی از چیزهایی که می‌توانند گوگل را گیج کند، محتوای بی‌نظم و بدون هدف و بدون ساختار است.

اجازه  بدهید مثالی بزنم که بهتر متوجه شوید.

فرض کنید شما در وب سایت خود یک صفحه دارید که در مورد فردی به نام جمشید می‌نویسد، بعد از گذشت چند وقت گوگل از طریق لینک‌های مختلفی که در صفحات مختلف وب‌سایت شما قرار دارد آن صفحه را پیدا می‌کند.

حال فرض می‌کنیم شما خواسته یا ناخواسته یک یا چند صفحه دیگر را هم برای اسم جمشید بهینه‌سازی میکنید. واکنش گوگل بعد از روبرو شدن با این موضوع چیست؟

جمشید دو تا شده! 🙂

خب منطقی است که گوگل گیج خواهد شد و در برخی موارد هم صفحه‌ای که تمایل ندارید در رتبه بالاتر نتایج جستجو قرار خواهد گرفت که به اصطلاح به این موضوع کنیبالایزیشن گفته می‌شود.

URL استاندارد چه ویژگی‌هایی باید داشته باشد؟

در ابتدا به شما پیشنهاد می‌کنم در مورد اینکه می‌خواهید از URL فارسی استفاده کنید یا خیر تصمیم‌گیری کنید.

برای راهنمایی در این مورد پیشنهاد میکنم مقاله URL فارسی یا انگلیسی را مطالعه کنید.

اندازه یک URL استاندارد

یکی از مواردی که کارشناس‌های سئو در ایران به شدت به آن اعتقاد دارند، تاثیر کوتاه بودن آدرس صفحات در نتایج جستو است.

ابتدا باید منظور از کوتاه بودن و بلند بودن را مشخص کنیم. کوتاه بودن یک عبارت و یا جمله کاملا یک موضوع نسبی است و ممکن است یک جمله از نظر فردی کوتاه و از نظر فردی دیگر بسیار بلند باشد.

اگر عبارت URL Structure را جستجو کنید یکی از مهمترین منابعی که مشاهده خواهید کرد صفحه راهنمای ساختار URL گوگل را مشاهده خواهید کرد.

https://developers.google.com/search/docs/advanced/guidelines/url-structure

تعداد کارکتر آدرس همین صفحه ای که در مقابل شماست ۷۵ عدد است.

البته پیشنهاد افزونه RankMath در نرم‌افزار وردپرس نیز حداکثر همین تعداد است.

تصویری از فضای افزونه رنکمث در وردپرس و اشاره به بخشی که اشاره میشود که کاراکتر‌های URL باید به چه اندزه باشد.

حتی در صورتی که این موضوع درست باشد و برای گوگل کوتاه بودن آدرس صفحات یک نکته مثبت هر صفحه وب باشد این تعداد کارکتر ظاهراً از دید گوگل بلند نیست.

اگر دلیل کوتاه بودن URL برای شما این است که در نتایج گوگل URL صفحه مورد نظر شما خورد نشود و به طور کامل نمایش داده شود باید به ۲ نکته توجه کنید.

نکته اول اینکه مدت‌هاست دیگر گوگل URLهای صفحات مختلف را در نتایج خود به کاربران نمایش نمی‌دهد و بجای آن درصورتیکه وب‌سایت از BreadCrumb به صورت کدهای استراکچرد دیتا استفاده کرده باشد آن را نمایش می‌دهد.

درصورتی که وب‌سایت از کدهای استراکچرد دیتای Breadcrumb استفاده نکرده باشد URL صفحه را به صورت پوشه به پوشه مشابه مسیر راهنما یا همان Breadcrumb خورد میکند و در نتایج نمایش می‌دهد.

تصویری از صفحه SERP گوگل که یه جای URL سایت ها از Breadcrumbs آنها استفاده کرده است.

نکته دوم این است که درصورتیکه بخواهید URL مورد نظر شما برای گوگل طولانی به نظر نیاید نمی‌توانید اندازه آن را براساس تعداد حروف محاسبه کنید.

این موضوع به این دلیل است که گوگل میزان اندازه عنوان، URL و توضیحاتی را که در نتایج خود نمایش می‌دهد براساس تعداد پیکسل مشخصی و براساس عرض صفحه محاسبه می‌کند.

معمولاً عنوان یا همان تایتل به اندازه ۶۰۰ پیکسل نمایش داده می‌شود، تگ توضیحات یا متادسکریپشن به اندازه ۹۲۰ پیکسل معمولاً نمایش داده می‌شود و URL هم معمولاً به همان اندازه Title فضا برای نمایش داده شدن دارد.

توسط نرم‌افزار Screaming Frog SEO Spider می‌توانید اندازه عنوان، توضیحات و URL تعداد زیادی از صفحات وب‌سایت خود را به صورت کارکتر و یا پیکسل بدست آورید.

پیشنهادهای گوگل برای ساختار URL استاندارد

تا جای ممکن ساده باشد

با مطالعه راهنمای ساختار URL گوگل متوجه خواهید شد که ساده بودن آدرس ها و نظم ساختاری آدرس ها برای گوگل نسبت به کوتاه بودن آدرس صفحات از اهمیت بیشتری برخوردار است.

(هرچند من چیزی در مورد کوتاه بودن آدرس‌ها مشاهده نکردم)

تا جای ممکن منظم و منطقی باشد.

استفاده از پارمترهای عدد و آدرسهای کدشده و بی‌معنی باعث می‌شود کاربران کمتری تصمیم به کلیک بر روی آن URL بگیرند.

به طور مثال این دو آدرس را مشاهده کنید:

http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

در مقابل

http://en.wikipedia.org/wiki/Aviation

خود شما کدام یک را انتخاب میکنید؟

برای نظم بخشیدن و ساختار دادن به آدرس‌ها و صفحات وبسایت میتوانید مواردی را که در ادامه به آن‌ها اشاره خواهم کرد انجام دهید:

می‌توانید آدرس صفحات را به صورت پوشه در پوشه و زیرمجموعه‌ای به صورتی قراردهید که کاملاً مشخص باشد هر صفحه زیرمجموعه چه موضوع یا موضوعاتی است.

این کار هنگام آنالیز وب‌سایت توسط ابزارهایی مانند گوگل سرچ کنسول و گوگل انالیتیکس به شما توانایی‌های زیادی می‌دهد. مخصوصا اگر بخواهید کلمات کلیدی وب‌سایت را از نظر سرچ اینتنت جدا کنید.

همچنین می‌توانید از کد استراکچرد دیتای BreadCrumb نیز استفاده کنید تا گوگل بتواند وب‌سایت شما را به صورت یک درخت‌واره مشاهده کند.

یکی دیگر از کارهایی که میتواند به صفحات شما نظم بدهد استفاده از فهرست‌های درون صفحه‌ای است.

این فهرست‌ها باعث می‌شوند که هر بخش یا هر هدینگ از صفحه شما یک آدرس مجزا بگیرد و این مورد می‌تواند به درک بهتر و بخش بندی بهتر قسمت‌های مختلف صفحه توسط روبات گوگل کمک کند.

از جداکننده های مناسب استفاده کنید

همچنین پیشنهاد شده است که از یک جدا کننده بین کلمات URL استفاده شود به طور مثال کلمات با خط تیره جدا شوند.
گوگل پیشنهاد میدهد از خط تیره عادی (hyphen) یا همان – بجای خط تیره باشیفت (underscores) یا همان ـ استفاده شود.
طبیتعا آدرس example.com/green-dress خوانایی بیشتری نسبت به آدرس example.com/greendress دارد.

چندین آدرس برای یک صفحه ایجاد نکنید

همچنین پیشنهاد میکنم همانطور که از پارامترهای عددی برای ایجاد URL صفحات استفاده نمیکنید آدرس‌های مشابه را توسط ریدایرکت 301 و استفاده از تگ کنونیکال از فهرست کراول گوگل حذف کنید.

باز کردن چنیدن URL تکراری که به محتوای یکسانی ختم می‌شوند باعث می‌شود گوگل پهنای باند بیشتری برای کراول سایت شما استفاده کند.

این مورد باعث مصرف بیش از حد کراول بادجت شما و کندتر شدن سرعت ایندکس شدن صفحات شما خواهد شد.

مواردی که باعث ایجاد آدرس‌های جدید برای یک محتوا میشوند:

  • نسخه های مختلف یک محتوا مانند PDF، پرینت، موبایل، amp و …
  • فیلترهای مختلف از یک صفحه مثل: جزییات محصول و ویژگی‌های مختلف مانند رنگ و اندازه و …
  • ایجاد محتوا به صورت پویا مثلاً محتوای تبلیغاتی یا محتوایی که با برچسب‌های زمان تغییر می کنند.

و موارد دیگر

برای حل مشکل اینگونه URLها میتوانید اقداماتی از قبیل محدود کردن مسیر اینگونه آدرس‌ها در فایل robots.txt و یا اضافه کردن برچسب nofollow به لینک های این صفحات انجام دهید.

پرسش‌های رایج

منظور از ساختار URL چیست؟

ساختار URL یعنی ساختمان ظاهری یک URLمشخص چگونه به نظر می‌رسد. این بحث شامل مواردی همچون اندازه URL، خوانایی و ظاهر، بامعنی بودن، بخش‌بندی کردن و مواردی نظیر آنهاست.

اجزای یک URL کدام هستند؟

۱. پروتکل: که معمولا به دو صورت http و https می‌باشد.
۲. ساب‌دامین: این بخش اختیاری است. به طور مثال www
۳. هاست: این بخش نمایانگر برند وب‌سایت و میزبانی است که فایل‌های URL درون آن سایت قرار گرفته اند.
۴. تی‌ال‌دی: منظور از TLD همان پسوند دامنه است به طور مثال .com یا .ir
۵. دایرکتوری: اگر بعد از دامین، کلماتی در آدرس قرار بگیرد و انتهای آن کلمه با اسلش (/) بسته شده باشد ان کلمه، یک پوشه و یا دایرکتوری درنظر گرفته می‌شود.
۶. فایل: اگر بعد از دامین و یا دایرکتوری عبارتی قرار گیرد ولی با اسلش بسته نشود به عنوان یک فایل شناسایی خواهد شد که می‌تواند پسوندهایی مانند .html و … نیز داشته باشد.
۷. کوئری استرینگ: در انتهای هر URL می‌توان مقادیر دیگری نیز وارد کرد که باعث باز شدن یک بخش خاص از صفحات و یا اجرای فیلتر خاصی در صفحات خواهد شد که این بخش معمولا با علامت سوال و یا هشتگ از URL اصلی جدا می‌شود.

مجید عابد
مجید عابد

مجید عابد هستم، فارغ التحصیل مقطع کارشناسی رشته حقوق، اولین وبلاگ خودم رو سال ۱۳۸۳ راه انداختم و از همون زمان درحال مطالعه راهکارهای افزایش بازدید وبلاگ و وبسایت (که بعدها به سئو معروف شد) بودم.
این روزها درحال ارائه خدمات مختلف سئو و مشاوره به برندهای مختلفی در ایران و کشورهای دیگه هستم.
خیلی فرصت نمی کنم در شبکه های اجتماعی باشم و به همین خاطر این وبلاگ رو راه انداختم تا بتونم بعضی از تجربه ها و دانشم رو با شما به اشتراک بگذارم، اینطوری هم من بیشتر مطالعه میکنم و از شما چیزای مختلف یاد میگیرم و هم احتمالا برای شما مفید باشه.

مقالات: 36

10 دیدگاه

    • اگه بخوام خیلی ساده بگم منظور از کراول باجت همون میزان صفحاتی هست که گوگل در یک بازه زمانی مشخص مثلا سه ماه از سایت مورد نظر ما کراول میکنه.
      البته من اینجا برای سادگی گفتم صفحات ولی هر قسمتی از وب سایت که یک URL مشخص داشته باشه و امکان این رو داشته باشه که توسط گوگل کراول بشه مثل تصاویر، فایل های، کامنت ها در صفحات و … میتونه جزو کرال باجت حساب بشه.
      به طور خلاصه اهمیت کراول باجت اینجایی مشخص میشه که اگه گوگل صفحات و بخش‌های مختلف رو نتونه کراول کنه و روبات گوگل نتونه با خزش صفحات مختلف سایت رو شناسایی کنه، طبیعتا اون صفحات ایندکس نمی شن و در نتایج گوگل نمایش داده نمی شن.
      از اونجایی که امکانات گوگل محدوده و نمی تونه هر لحظه درحال چرخیدن توی سایت مورد نظر ما باشه یه میزان خاصی از کراول کردن رو برای سایت مورد نظر ما در نظر میگیره که اون میزان برحسب یه سری فاکتورها مثل پیج رنک وب سایت، تعداد بازدید وب سایت، حجم مطالب وب‌سایت و … توسط خود گوگل محاسبه میشه.
      حالا اگه ما این بودجه ای که برای کراول صفحاتمون در نظر گرفته شده رو بجای تمرکز روی محتوای جدید ببریم سراغ URLهایی با محتوای تکراری و یا صفحات خطا و موارد مشابه، اتفاقی که میفته اینه که یه سری از صفحات ما ایندکس نمیشن یا خیلی زیاد طول میکشه تا ایندکس بشن.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *