معرفی Semantic Web

توسط sajjad

12 شهریور, 1401

در Articles

بدون دیدگاه

Semantic Web (وب معنایی)، که گاهی اوقات به عنوان وب ۳.۰ شناخته می شود (نباید با وب ۳ اشتباه شود)، توسعه وب جهانی از طریق استانداردهای تعیین شده توسط کنسرسیوم وب جهانی (W3C) است. هدف وب معنایی این است که داده‌های اینترنتی را برای ماشین قابل خواندن کند.

برای فعال کردن رمزگذاری معناشناسی با داده ها، از فناوری هایی مانند چارچوب توصیف منابع (RDF) و زبان هستی شناسی وب (OWL) استفاده می شود. این فناوری‌ها برای نمایش رسمی فراداده استفاده می‌شوند. به عنوان مثال، هستی شناسی می تواند مفاهیم، روابط بین موجودات و دسته بندی اشیا را توصیف کند. این معناشناسی تعبیه شده مزایای قابل توجهی مانند استدلال نسبت به داده ها و عملکرد با منابع داده ناهمگن را ارائه می دهد.

این استانداردها فرمت های رایج داده ها و پروتکل های مبادله در وب را ترویج می کنند که اساساً RDF است. طبق W3C، «وب معنایی چارچوب مشترکی را ارائه می‌کند که اجازه می‌دهد داده‌ها را در سراسر برنامه‌ها، سازمان‌ها و مرزهای جامعه به اشتراک گذاشته و مجدداً استفاده شود». بنابراین وب معنایی به عنوان یکپارچه کننده در میان برنامه ها و سیستم های مختلف محتوا و اطلاعات در نظر گرفته می شود.

این اصطلاح توسط تیم برنرز لی برای شبکه‌ای از داده‌ها (یا وب داده) که می‌تواند توسط ماشین‌ها پردازش شود، ابداع شد، یعنی شبکه‌ای که بیشتر معنی در آن قابل خواندن توسط ماشین است. در حالی که منتقدان امکان‌سنجی آن را زیر سوال برده‌اند، طرفداران استدلال می‌کنند که کاربردها در علوم کتابداری و اطلاعات، صنعت، زیست‌شناسی و تحقیقات علوم انسانی قبلاً اعتبار مفهوم اصلی را ثابت کرده‌اند.

برنرز لی در ابتدا دیدگاه خود را از وب معنایی در سال ۱۹۹۹ به شرح زیر بیان کرد:

من رویایی برای وب دارم [که در آن رایانه ها] قادر به تجزیه و تحلیل تمام داده های موجود در وب - محتوا، پیوندها و تراکنش های بین افراد و رایانه ها هستند. یک «وب معنایی» که این امکان را فراهم می‌کند، هنوز پدیدار نشده است، اما زمانی که به وجود آمد، مکانیسم‌های روزمره تجارت، بوروکراسی و زندگی روزمره ما توسط ماشین‌هایی که با ماشین‌ها صحبت می‌کنند اداره می‌شوند. «عوامل هوشمند» که مردم برای سال‌ها تبلیغ می‌کردند، سرانجام محقق خواهند شد.

مقاله ساینتیفیک آمریکا در سال ۲۰۰۱ توسط برنرز لی، هندلر و لاسیلا تکامل مورد انتظار وب موجود را به وب معنایی توصیف کرد. در سال ۲۰۰۶، برنرز لی و همکارانش بیان کردند که: "این ایده ساده ... تا حد زیادی محقق نشده باقی می ماند". در سال ۲۰۱۳، بیش از چهار میلیون دامنه وب (از حدود ۲۵۰ میلیون کل) دارای نشانه گذاری Semantic Web بودند.

پیش زمینه

مفهوم مدل شبکه معنایی در اوایل دهه ۱۹۶۰ توسط محققانی مانند دانشمند شناختی آلن ام. کالینز، زبان شناس ام. راس کویلیان و روانشناس الیزابت اف. هنگامی که در زمینه اینترنت مدرن به کار می رود، با درج ابرداده های قابل خواندن توسط ماشین در مورد صفحات و نحوه ارتباط آنها با یکدیگر، شبکه صفحات وب قابل خواندن توسط انسان را گسترش می دهد. این امر به نمایندگان خودکار امکان می دهد تا هوشمندانه تر به وب دسترسی داشته باشند و وظایف بیشتری را از طرف کاربران انجام دهند. اصطلاح "Semantic Web" توسط تیم برنرز لی، مخترع شبکه جهانی وب و مدیر کنسرسیوم وب جهانی ("W3C") که بر توسعه استانداردهای وب معنایی پیشنهادی نظارت دارد، ابداع شد. او وب معنایی را به عنوان «وبی از داده‌ها که می‌تواند به‌طور مستقیم و غیرمستقیم توسط ماشین‌ها پردازش شود» تعریف می‌کند.

بسیاری از فناوری‌های پیشنهاد شده توسط W3C قبل از قرار گرفتن در زیر چتر W3C وجود داشتند. اینها در زمینه‌های مختلف، به‌ویژه آن‌هایی که با اطلاعاتی سروکار دارند که دامنه‌ای محدود و تعریف‌شده را در بر می‌گیرند، و در جایی که اشتراک‌گذاری داده‌ها یک ضرورت رایج است، مانند تحقیقات علمی یا تبادل داده‌ها در بین مشاغل، استفاده می‌شود. علاوه بر این، فناوری های دیگری با اهداف مشابه مانند میکروفرمت ها ظهور کرده اند.

محدودیت های HTML
بسیاری از فایل‌ها در یک کامپیوتر معمولی نیز می‌توانند به‌طور آزادانه به اسناد قابل خواندن توسط انسان و داده‌های قابل خواندن توسط ماشین تقسیم شوند. اسنادی مانند پیام های پستی، گزارش ها و بروشورها توسط انسان خوانده می شود. داده‌هایی مانند تقویم‌ها، دفترچه‌های آدرس، فهرست‌های پخش و صفحه‌گسترده‌ها با استفاده از یک برنامه کاربردی ارائه می‌شوند که به آنها امکان مشاهده، جستجو و ترکیب می‌دهد.

در حال حاضر، شبکه جهانی وب عمدتاً بر اساس اسناد نوشته شده به زبان نشانه گذاری فرامتن (HTML)، یک قرارداد نشانه گذاری است که برای کدگذاری متنی که با اشیاء چندرسانه ای مانند تصاویر و فرم های تعاملی در هم آمیخته شده است، استفاده می شود. تگ های فراداده روشی را ارائه می دهند که توسط آن رایانه ها می توانند محتوای صفحات وب را دسته بندی کنند. در مثال‌های زیر، به نام فیلدهای «کلید واژه‌ها»، «توضیحات» و «نویسنده» مقادیری مانند «محاسبات»، «ویجت‌های ارزان برای فروش» و «جان دو» اختصاص داده شده است.

<meta name="keywords" content="computing, computer studies, computer" />
<meta name="description" content="Cheap widgets for sale" />
<meta name="author" content="John Doe" />

به دلیل این برچسب‌گذاری و دسته‌بندی ابرداده، سایر سیستم‌های رایانه‌ای که می‌خواهند به این داده‌ها دسترسی داشته باشند و به اشتراک بگذارند، می‌توانند به راحتی مقادیر مربوطه را شناسایی کنند.

با HTML و ابزاری برای رندر کردن آن (شاید نرم افزار مرورگر وب، شاید یک عامل دیگر)، می توان صفحه ای ایجاد و ارائه کرد که مواردی را برای فروش فهرست می کند. HTML این صفحه کاتالوگ می تواند اظهارات ساده و در سطح سند مانند "عنوان این سند 'Superstore ابزارک" است، اما هیچ قابلیتی در خود HTML وجود ندارد که به طور واضح ادعا کند که مثلاً شماره مورد X586172 یک Acme است. Gizmo با قیمت خرده فروشی ۱۹۹ یورو یا اینکه یک محصول مصرفی است. در عوض، HTML فقط می تواند بگوید که گستره متن "X586172" چیزی است که باید در نزدیکی "Acme Gizmo" و "€۱۹۹" و غیره قرار گیرد. هیچ راهی برای گفتن "این یک کاتالوگ است" یا حتی برای اثبات آن وجود ندارد. "Acme Gizmo" نوعی عنوان است یا اینکه "۱۹۹ یورو" قیمت است. همچنین هیچ راهی برای بیان اینکه این تکه‌های اطلاعات در توصیف یک مورد مجزا به هم متصل شده‌اند، متمایز از سایر موارد ذکر شده در صفحه وجود ندارد.

HTML معنایی به جای مشخص کردن جزئیات طرح‌بندی به‌طور مستقیم به تمرین سنتی HTML نشانه‌گذاری به دنبال هدف اشاره دارد. به عنوان مثال، استفاده از <em> نشان دهنده "تأکید" به جای <i>، که حروف کج را مشخص می کند. جزئیات طرح‌بندی در ترکیب با برگه‌های سبک آبشاری به مرورگر واگذار می‌شود. اما این عمل از تعیین معنایی اشیایی مانند اقلام برای فروش یا قیمت ها کوتاهی می کند.

میکروفرمت ها نحو HTML را برای ایجاد نشانه گذاری معنایی قابل خواندن توسط ماشین در مورد اشیاء از جمله افراد، سازمان ها، رویدادها و محصولات گسترش می دهند. ابتکارات مشابه عبارتند از RDFa، Microdata و Schema.org.

راه حل های Semantic Web

Semantic Web راه حل را فراتر می برد. این شامل انتشار به زبان هایی است که به طور خاص برای داده ها طراحی شده اند: چارچوب توصیف منابع (RDF)، زبان هستی شناسی وب (OWL) و زبان نشانه گذاری توسعه پذیر (XML). HTML اسناد و پیوندهای بین آنها را توصیف می کند. در مقابل، RDF، OWL و XML می توانند چیزهای دلخواه مانند افراد، جلسات یا قطعات هواپیما را توصیف کنند.

این فناوری ها به منظور ارائه توضیحاتی که مکمل یا جایگزین محتوای اسناد وب هستند، ترکیب می شوند. بنابراین، محتوا ممکن است خود را به‌عنوان داده‌های توصیفی ذخیره‌شده در پایگاه‌های اطلاعاتی قابل دسترسی به وب، یا به‌عنوان نشانه‌گذاری در اسناد (به‌ویژه در HTML توسعه‌پذیر (XHTML) که با XML آمیخته شده است، یا اغلب، صرفاً در XML، با نشانه‌های چیدمان یا رندر که جداگانه ذخیره می‌شوند نشان دهد. ). توصیف‌های قابل خواندن توسط ماشین، مدیران محتوا را قادر می‌سازد تا به محتوا معنا بیافزایند، یعنی ساختار دانشی را که در مورد آن محتوا داریم، توصیف کنند. به این ترتیب، یک ماشین می‌تواند خود دانش را به جای متن، با استفاده از فرآیندهایی شبیه به استدلال و استنتاج قیاسی انسانی پردازش کند، در نتیجه نتایج معنادارتری به‌دست آورد و به رایانه‌ها در انجام جمع‌آوری و تحقیق خودکار اطلاعات کمک کند.