معرفی Semantic Web
توسط sajjad
Semantic Web (وب معنایی)، که گاهی اوقات به عنوان وب ۳.۰ شناخته می شود (نباید با وب ۳ اشتباه شود)، توسعه وب جهانی از طریق استانداردهای تعیین شده توسط کنسرسیوم وب جهانی (W3C) است. هدف وب معنایی این است که دادههای اینترنتی را برای ماشین قابل خواندن کند.
برای فعال کردن رمزگذاری معناشناسی با داده ها، از فناوری هایی مانند چارچوب توصیف منابع (RDF) و زبان هستی شناسی وب (OWL) استفاده می شود. این فناوریها برای نمایش رسمی فراداده استفاده میشوند. به عنوان مثال، هستی شناسی می تواند مفاهیم، روابط بین موجودات و دسته بندی اشیا را توصیف کند. این معناشناسی تعبیه شده مزایای قابل توجهی مانند استدلال نسبت به داده ها و عملکرد با منابع داده ناهمگن را ارائه می دهد.
این استانداردها فرمت های رایج داده ها و پروتکل های مبادله در وب را ترویج می کنند که اساساً RDF است. طبق W3C، «وب معنایی چارچوب مشترکی را ارائه میکند که اجازه میدهد دادهها را در سراسر برنامهها، سازمانها و مرزهای جامعه به اشتراک گذاشته و مجدداً استفاده شود». بنابراین وب معنایی به عنوان یکپارچه کننده در میان برنامه ها و سیستم های مختلف محتوا و اطلاعات در نظر گرفته می شود.
این اصطلاح توسط تیم برنرز لی برای شبکهای از دادهها (یا وب داده) که میتواند توسط ماشینها پردازش شود، ابداع شد، یعنی شبکهای که بیشتر معنی در آن قابل خواندن توسط ماشین است. در حالی که منتقدان امکانسنجی آن را زیر سوال بردهاند، طرفداران استدلال میکنند که کاربردها در علوم کتابداری و اطلاعات، صنعت، زیستشناسی و تحقیقات علوم انسانی قبلاً اعتبار مفهوم اصلی را ثابت کردهاند.
برنرز لی در ابتدا دیدگاه خود را از وب معنایی در سال ۱۹۹۹ به شرح زیر بیان کرد:
من رویایی برای وب دارم [که در آن رایانه ها] قادر به تجزیه و تحلیل تمام داده های موجود در وب - محتوا، پیوندها و تراکنش های بین افراد و رایانه ها هستند. یک «وب معنایی» که این امکان را فراهم میکند، هنوز پدیدار نشده است، اما زمانی که به وجود آمد، مکانیسمهای روزمره تجارت، بوروکراسی و زندگی روزمره ما توسط ماشینهایی که با ماشینها صحبت میکنند اداره میشوند. «عوامل هوشمند» که مردم برای سالها تبلیغ میکردند، سرانجام محقق خواهند شد.
مقاله ساینتیفیک آمریکا در سال ۲۰۰۱ توسط برنرز لی، هندلر و لاسیلا تکامل مورد انتظار وب موجود را به وب معنایی توصیف کرد. در سال ۲۰۰۶، برنرز لی و همکارانش بیان کردند که: "این ایده ساده ... تا حد زیادی محقق نشده باقی می ماند". در سال ۲۰۱۳، بیش از چهار میلیون دامنه وب (از حدود ۲۵۰ میلیون کل) دارای نشانه گذاری Semantic Web بودند.
پیش زمینه
مفهوم مدل شبکه معنایی در اوایل دهه ۱۹۶۰ توسط محققانی مانند دانشمند شناختی آلن ام. کالینز، زبان شناس ام. راس کویلیان و روانشناس الیزابت اف. هنگامی که در زمینه اینترنت مدرن به کار می رود، با درج ابرداده های قابل خواندن توسط ماشین در مورد صفحات و نحوه ارتباط آنها با یکدیگر، شبکه صفحات وب قابل خواندن توسط انسان را گسترش می دهد. این امر به نمایندگان خودکار امکان می دهد تا هوشمندانه تر به وب دسترسی داشته باشند و وظایف بیشتری را از طرف کاربران انجام دهند. اصطلاح "Semantic Web" توسط تیم برنرز لی، مخترع شبکه جهانی وب و مدیر کنسرسیوم وب جهانی ("W3C") که بر توسعه استانداردهای وب معنایی پیشنهادی نظارت دارد، ابداع شد. او وب معنایی را به عنوان «وبی از دادهها که میتواند بهطور مستقیم و غیرمستقیم توسط ماشینها پردازش شود» تعریف میکند.
بسیاری از فناوریهای پیشنهاد شده توسط W3C قبل از قرار گرفتن در زیر چتر W3C وجود داشتند. اینها در زمینههای مختلف، بهویژه آنهایی که با اطلاعاتی سروکار دارند که دامنهای محدود و تعریفشده را در بر میگیرند، و در جایی که اشتراکگذاری دادهها یک ضرورت رایج است، مانند تحقیقات علمی یا تبادل دادهها در بین مشاغل، استفاده میشود. علاوه بر این، فناوری های دیگری با اهداف مشابه مانند میکروفرمت ها ظهور کرده اند.
محدودیت های HTML
بسیاری از فایلها در یک کامپیوتر معمولی نیز میتوانند بهطور آزادانه به اسناد قابل خواندن توسط انسان و دادههای قابل خواندن توسط ماشین تقسیم شوند. اسنادی مانند پیام های پستی، گزارش ها و بروشورها توسط انسان خوانده می شود. دادههایی مانند تقویمها، دفترچههای آدرس، فهرستهای پخش و صفحهگستردهها با استفاده از یک برنامه کاربردی ارائه میشوند که به آنها امکان مشاهده، جستجو و ترکیب میدهد.
در حال حاضر، شبکه جهانی وب عمدتاً بر اساس اسناد نوشته شده به زبان نشانه گذاری فرامتن (HTML)، یک قرارداد نشانه گذاری است که برای کدگذاری متنی که با اشیاء چندرسانه ای مانند تصاویر و فرم های تعاملی در هم آمیخته شده است، استفاده می شود. تگ های فراداده روشی را ارائه می دهند که توسط آن رایانه ها می توانند محتوای صفحات وب را دسته بندی کنند. در مثالهای زیر، به نام فیلدهای «کلید واژهها»، «توضیحات» و «نویسنده» مقادیری مانند «محاسبات»، «ویجتهای ارزان برای فروش» و «جان دو» اختصاص داده شده است.
<meta name="keywords" content="computing, computer studies, computer" />
<meta name="description" content="Cheap widgets for sale" />
<meta name="author" content="John Doe" />
به دلیل این برچسبگذاری و دستهبندی ابرداده، سایر سیستمهای رایانهای که میخواهند به این دادهها دسترسی داشته باشند و به اشتراک بگذارند، میتوانند به راحتی مقادیر مربوطه را شناسایی کنند.
با HTML و ابزاری برای رندر کردن آن (شاید نرم افزار مرورگر وب، شاید یک عامل دیگر)، می توان صفحه ای ایجاد و ارائه کرد که مواردی را برای فروش فهرست می کند. HTML این صفحه کاتالوگ می تواند اظهارات ساده و در سطح سند مانند "عنوان این سند 'Superstore ابزارک" است، اما هیچ قابلیتی در خود HTML وجود ندارد که به طور واضح ادعا کند که مثلاً شماره مورد X586172 یک Acme است. Gizmo با قیمت خرده فروشی ۱۹۹ یورو یا اینکه یک محصول مصرفی است. در عوض، HTML فقط می تواند بگوید که گستره متن "X586172" چیزی است که باید در نزدیکی "Acme Gizmo" و "€۱۹۹" و غیره قرار گیرد. هیچ راهی برای گفتن "این یک کاتالوگ است" یا حتی برای اثبات آن وجود ندارد. "Acme Gizmo" نوعی عنوان است یا اینکه "۱۹۹ یورو" قیمت است. همچنین هیچ راهی برای بیان اینکه این تکههای اطلاعات در توصیف یک مورد مجزا به هم متصل شدهاند، متمایز از سایر موارد ذکر شده در صفحه وجود ندارد.
HTML معنایی به جای مشخص کردن جزئیات طرحبندی بهطور مستقیم به تمرین سنتی HTML نشانهگذاری به دنبال هدف اشاره دارد. به عنوان مثال، استفاده از <em> نشان دهنده "تأکید" به جای <i>، که حروف کج را مشخص می کند. جزئیات طرحبندی در ترکیب با برگههای سبک آبشاری به مرورگر واگذار میشود. اما این عمل از تعیین معنایی اشیایی مانند اقلام برای فروش یا قیمت ها کوتاهی می کند.
میکروفرمت ها نحو HTML را برای ایجاد نشانه گذاری معنایی قابل خواندن توسط ماشین در مورد اشیاء از جمله افراد، سازمان ها، رویدادها و محصولات گسترش می دهند. ابتکارات مشابه عبارتند از RDFa، Microdata و Schema.org.
راه حل های Semantic Web
Semantic Web راه حل را فراتر می برد. این شامل انتشار به زبان هایی است که به طور خاص برای داده ها طراحی شده اند: چارچوب توصیف منابع (RDF)، زبان هستی شناسی وب (OWL) و زبان نشانه گذاری توسعه پذیر (XML). HTML اسناد و پیوندهای بین آنها را توصیف می کند. در مقابل، RDF، OWL و XML می توانند چیزهای دلخواه مانند افراد، جلسات یا قطعات هواپیما را توصیف کنند.
این فناوری ها به منظور ارائه توضیحاتی که مکمل یا جایگزین محتوای اسناد وب هستند، ترکیب می شوند. بنابراین، محتوا ممکن است خود را بهعنوان دادههای توصیفی ذخیرهشده در پایگاههای اطلاعاتی قابل دسترسی به وب، یا بهعنوان نشانهگذاری در اسناد (بهویژه در HTML توسعهپذیر (XHTML) که با XML آمیخته شده است، یا اغلب، صرفاً در XML، با نشانههای چیدمان یا رندر که جداگانه ذخیره میشوند نشان دهد. ). توصیفهای قابل خواندن توسط ماشین، مدیران محتوا را قادر میسازد تا به محتوا معنا بیافزایند، یعنی ساختار دانشی را که در مورد آن محتوا داریم، توصیف کنند. به این ترتیب، یک ماشین میتواند خود دانش را به جای متن، با استفاده از فرآیندهایی شبیه به استدلال و استنتاج قیاسی انسانی پردازش کند، در نتیجه نتایج معنادارتری بهدست آورد و به رایانهها در انجام جمعآوری و تحقیق خودکار اطلاعات کمک کند.
پست های توصیه شده
کلان داده
14 مهر, 1402
تحول دیجیتال
14 مهر, 1402
تجزیه و تحلیل داده ها
14 مهر, 1402