วันศุกร์ที่ 31 ตุลาคม พ.ศ. 2557

ความรู้เกี่ยวกับ Metadata

เมทาดาทา (Metadata) 
          
         เมทาดาทา (Metadata)  หมายถึง ข้อมูลที่ใช้บ่งชี้ บอกคุณลักษณะ หรือให้ข้อมูลเกี่ยวกับข้อมูล ซึ่งมีอยู่มากมายหลายลักษณะ สำหรับงานห้องสมุด ได้นำเมทาดาทามาช่วยในการลงรายการข้อมูลของทรัพยากรสารสนเทศต่างๆ ที่เพิ่มจำนวนขึ้นอย่างรวดเร็ว ทั้งทรัพยากรสารสนเทศที่เป็นดิจิทัล และไม่เป็นดิจิทัล เนื่องจาก เมทาดาทาช่วยเพิ่มความสามารถในการค้นคืน และเข้าถึงทรัพยากรสารสนเทศ ช่วยสงวนรักษาบริบทอื่นๆ ที่สำคัญของทรัพยากรสารสนเทศ ขยายขอบเขตการใช้งานสารสนเทศ และบ่งชี้คุณสมบัติเฉพาะของสารสนเทศ มาตรฐานการลงรายการต่างๆ ที่นำมาใช้ในงานห้องสมุด จึงทำให้เกิดความเข้าใจที่ตรงกัน ทำให้สะดวก และไม่เกิดความสับสนในการใช้ทรัพยากรสารสนเทศ
       ส่วนมาตรฐานเมทาดาทามีอยู่มากมาย แต่ละมาตรฐานมีความแตกต่างกันในด้านการนำไปใช้ ทั้งนี้ ทุกมาตรฐานมีข้อดี และข้อจำกัดไม่เหมือนกัน การที่ห้องสมุดจะเลือกนำมาตรฐานใดมาใช้ ต้องพิจารณาถึงองค์ประกอบ และขอบเขตงานของแต่ละห้องสมุด นอกจากนี้ ห้องสมุดอาจใช้มาตรฐานหลายมาตรฐานในการจัดการทรัพยากรสนเทศของห้องสมุดได้ เนื่องจากมาตรฐานเมทาดาสามารถนำมาใช้ร่วมกันกับมาตรฐานเมทาดาทาอื่นๆ ได้
            
มาตรฐานเมทาดาทาที่นำมาใช้ในห้องสมุดดิจิทัล

          มาตรฐานเมทาดาทาแต่ละแบบแผนมีความแตกต่างกันในด้านโครงสร้าง และการนำไปใช้ ห้องสมุดมีการใช้มาตรฐานเมทาดาทาในการจัดการทรัพยากรสารสนเทศในห้องสมุด เมทาดาทา จึงเป็นสิ่งจำเป็นสำหรับห้องสมุดดิจิทัล โดยมาตรฐานเมทาดาทาที่ห้องสมุดดิจิทัลนิยมนำมาใช้  มีดังต่อไปนี้

Dublin Core Metadata Initiative (DCMI)
          Dublin Core Metadata Initiative หรือ DCMI เป็นเมทาดาทาที่ได้รับการพัฒนามาบนพื้นฐานแนวคิดที่จะให้เป็นเมทาดาทาที่ง่ายต่อการใช้ และเน้นการอธิบายถึงสารสนเทศในรูปแบบอิเล็กทรอนิกส์ที่เกิดจากการประชุมเชิงปฎิบัติการของ Ohio College Library Consortium (OCLC) และ National Center for Supercomputing Applications (NCSA) ในปี 1995 ที่เมืองดับลิน รัฐโอไฮโอ ประเทศสหรัฐอเมริกาโดยมีจุดมุ่งหมายเพื่อกำหนดแบบแผนอย่างง่ายให้เจ้าของผลงานสามารถจัดการและให้คำอธิบายเนื้อหาสารสนเทศอิเล็กทรอนิกส์ด้วยตนเอง ทำให้สามารถสืบค้นร่วมกับฐานข้อมูลต่างระบบได้ ซึ่งมีหน่วยข้อมูลย่อยทั้งหมด 15 หน่วย และแบ่งชุดข้อมูลออกเป็น 3 กลุ่มใหญ่ ดังนี้
         1.หน่วยข้อมูลย่อยที่เกี่ยวกับเนื้อหาของทรัพยากรสารสนเทศเป็นหน่วยข้อมูลที่ใช้อธิบายเกี่ยวกับข้อมูล ดังนี้
            -  ชื่อเรื่อง  (Title)
            -  หัวเรื่อง (Subject)
            -  ต้นฉบับ (Source)
            -  เรื่องที่เกี่ยวข้อง (Relation)
            -  คำอธิบายเนื้อหา (Description)
            -  ประเภท (Type)
            - ขอบเขต (Coverage)
       2. หน่วยข้อมูลย่อย ที่เกี่ยวข้องกับทรัพย์สินทางปัญญา เป็นหน่วยข้อมูลที่ใช้อธิบายเกี่ยวกับข้อมูล ดังนี้
            -  ผู้เขียน หรือเจ้าของผลงาน (Author or Creator)
            - สำนักพิมพ์ (Publisher)
            - ผู้มีส่วนร่วมในผลงานนั้น ๆ  (Contributor)
            - สิทธิ (Rights)
        3.   หน่วยข้อมูลย่อยที่เกี่ยวข้องกับรูปแบบที่ปรากฏให้ใช้งาน เป็นหน่วยข้อมูลที่ใช้อธิบายเกี่ยวกับข้อมูล ดังนี้
             -  วัน เดือน ปี ที่สร้างผลงาน (Date)
             -  ภาษา (Language)
             -  รูปแบบของการนำเสนอผลงาน(Format)
            -  ตัวบ่งชี้หรือตัวระบุถึงทรัพยากร (Identifier)
         ตัวอย่าง การลงรายการดับลินคอร์ ในเขตข้อมูลชื่อเรื่องเจ้าของผลงาน ประเภท และรูปแบบการนำเสนอ จากเว็บไซต์ dublincore.org (Dublin Core Metadata Initiative Limited, n.d.)
                    Title="The Bronco Buster"
                    Creator="Frederic Remington"
                    Type="Physical object"
                    Format="bronze"
                    Format="22 in."

METS (Metadata Encoding and Transmission Standard)
          METS ย่อมาจาก Metadata Encoding and Transmission Standard เป็นมาตรฐานเมทาดาทาที่ใช้ในการเข้ารหัสข้อมูลเชิงโครงสร้างประเภทต่างๆ เพื่อระบุข้อมูลเชิงเทคนิค ทำการเชื่อมโยง และจัดระเบียบเอกสารสารสนเทศดิจิทัล โดยใช้ภาษาโครงร้าง XML ที่ทำการออกแบบมาเพื่อกำกับและจัดการเมทาดาทาประเภทต่างๆ ที่จำเป็นสำหรับการบรรยายและจัดการทรัพยากรสารสนเทศในรูปดิจิทัล โดยทำการเชื่อมต่อเมทาดาทาประเภทต่างๆ เข้าด้วยกัน และสามารถแลกเปลี่ยนข้อมูลต่างแหล่งกันอีกทั้งยังทำหน้าที่เป็นตัวกลางในการให้บริการทรัพยากรสารสนเทศแก่ผู้ใช้แบ่งเขตข้อมูลออกเป็น 7 ชุด ดังนี้
                   1. METS header <metsHdr> ระบุข้อมูล วันเดือนปีที่สร้าง วันเดือนปีที่ปรับปรุงล่าสุด สถานภาพ รวมทั้งชื่อและหน้าที่ของผู้รับผิดชอบในสร้าง
                   2. Descriptive metadata <dmdSec> ระบุเมทาดาทาที่ใช้อธิบายถึงทรัพยากรสารสนเทศดิจิทัล
                   3. Administrative metadata <amdSec> ระบุข้อมูลเกี่ยวกับเทคนิคการสร้างทรัพยากรสารสนเทศให้เป็นดิจิทัล ข้อมูลทางด้านทรัพย์สินทางปัญญา เมทาดาทาที่เกี่ยวข้องกับต้นฉบับ และแหล่งที่มาของทรัพยากรสารสนเทศ
                   4. File section <fileSec> ระบุเอกสารเวอร์ชั่นต่างๆ ของทรัพยากรสารสนเทศดิจิทัล
                    5. Structural map <structMap> ระบุโครงสร้างตามลำดับชั้นของเอกสารสารสนเทศดิจิทัลที่เกี่ยวข้องกัน  
                   6. Structural links <structLink> ระบุการเชื่อโยงหลายมิติ(hyperlinks)ที่เชื่อมโยงกับเอกสารสารสนเทศดิจิทัล
                   7. Behavior section <behaviorSec> เชื่อมโยงการใช้โปรแกรม
          ตัวอย่าง ระเบียน METS ของ Alabama blues / Booker T Sapps [sound recording] จากข้อมูลทางบรรณานุกรมของ Library of Congress (Library of Congress, 2011)
<mets:metsxmlns:rights="http://www.loc.gov/rights/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:lc="http://www.loc.gov/mets/profiles" xmlns:bib="http://www.loc.gov/mets/profiles/bibRecord" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:mets="http://www.loc.gov/METS/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" OBJID="loc.afc.afc9999005.1153" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/standards/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-2.xsd" PROFILE="lc:bibRecord">
   <mets:dmdSec ID="dmd1">
      <mets:mdWrap MDTYPE="MODS">
         <mets:xmlData>
            <mods:mods ID="mods1">
               <mods:titleInfo>
                  <mods:title>Alabama blues</mods:title>
              </mods:titleInfo>
              <mods:name type="personal">
                 <mods:namePart>Lomax, Alan</mods:namePart>
                 <mods:namePart type="date">1915-2002</mods:namePart>
                 <mods:role>
                    <mods:roleTerm type="text">Recordist</mods:roleTerm>
                 </mods:role>
              </mods:name>
              <mods:name type="personal">
                 <mods:namePart>Hurston, Zora Neale</mods:namePart>
                 <mods:role>
                    <mods:roleTerm type="text">Recordist</mods:roleTerm>
                 </mods:role>
              </mods:name>

RDF (Resource Description Framework)
          RDF ย่อมาจากResource Description Framework ได้รับการพัฒนาโดย World Wide Web Consortium (W3C) เป็นมาตรฐานที่ใช้บ่งบอกถึงกรอบในการกำหนดและแลกเปลี่ยนข้อมูลเมทาดาทาบนเว็บไซต์ซึ่งเป็นกรอบงานที่ใช้อธิบายถึงสิ่งที่อยู่ในเว็บไซต์ เป็นมาตรฐานที่เขียนด้วยภาษา XML จึงถูกเรียกว่า RDF/XML ทั้งนี้ RDF เป็นส่วนหนึ่งของโครงสร้างซีแมนติกเว็บ[1] (Semantic Web) ที่ออกแบบมาเพื่อให้คอมพิวเตอร์ และแอพพลิเคชันต่างๆ ของคอมพิวเตอร์สามารถอ่านได้ แต่ไม่ได้แสดงผลบนหน้าเว็บไซต์
          RDF มีคุณสมบัติในการผสานข้อมูล ถึงแม้ว่าโครงสร้างหรือแบบแผนของข้อมูลมีความแตกต่างกันซึ่งสามารถบูรณาการแบบแผนเมทาดาทาต่างๆ เข้าด้วยกัน และนำส่วนย่อยของเมทาดาทาต่างชนิดกันมารวมอยู่ในเอกสารเดียวกันได้โดยมีการอธิบายถึงข้อมูลทรัพยากรในเว็บไซต์ เช่น ชื่อเรื่อง ผู้เขียน ลิขสิทธิ์ เป็นต้น
          ตัวอย่าง ระเบียน RDF ที่นำมาปรับใช้กับมาตรฐานดับลินคอร์สำหรับการลงรายการทรัพยากรสารสนเทศอิเล็กทรอนิกส์ประเภทเสียง (Dublin Core Metadata Initiative Limited, n.d.)
          <rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
   <rdf:Descriptionrdf:about="http://media.example.com/audio/guide.ra"> 
<dc:creator>Rose Bush</dc:creator>
<dc:title>A Guide to Growing Roses</dc:title>
<dc:description>Describes process for planting and nurturing different kinds of rose bushes.</dc:description>
<dc:date>2001-01-20</dc:date>
</rdf:Description>
          </rdf:RDF>

EAD ย่อมาจาก Encoded Archival Description เป็นมาตรฐานที่เกิดจากความร่วมมือระหว่างหอสมุดรัฐสภาอเมริกัน (Library of Congress) และสมาคมนักจดหมายเหตุแห่งสหรัฐอเมริกา (Society of American Archivists) ซึ่งถูกพัฒนาขึ้นมาเพื่อเป็นวิธีการหนึ่งในการทำเครื่องหมาย (Mark up) ข้อมูลลงในเครื่องมือช่วยค้น โดยใช้ภาษา SGML และ XML เพื่อช่วยในการค้นหาและแสดงผลทางออนไลน์โดยเฉพาะเอกสาร จดหมายเหตุ เอกสารตัวเขียน และสิ่งพิมพ์พิเศษอื่นๆ เนื่องจากการลงรายการทรัพยากรกลุ่มนี้จะมีลักษณะที่เฉพาะกว่าเอกสารโดยทั่วไป
          ตัวอย่าง ระเบียนส่วนหัวของมาตรฐาน EAD (EAD header) (Library of Congress, 2006)
          <ead>
<eadheader audience="internal" countryencoding="iso3166-1" dateencoding="iso8601"
langencoding="iso639-2b" repositoryencoding="iso15511">
<eadid countrycode="us" mainagencycode="cu-i" publicid="-//us::cu-i//TEXT us::cu-i::p29.sgm//EN">Mildred Davenport Dance Programs and Dance School Materials, MS-P29
</eadid>

Meta Tag
          Meta Tags มีไว้สำหรับใส่รายละเอียดของเมทาดาทา โดยใช้ภาษา HTML ซึ่งจะบรรยายรายละเอียดเกี่ยวกับเนื้อหา และคำสำคัญของเว็บเพจที่กำลังแสดงผลอยู่ แต่ไม่แสดงผลทางหน้า      เว็บเพจ โดยเป็นมาตรฐานเดียวกันที่ทำให้ตัว Search Engine สามารถเข้ามาเก็บข้อมูลรายละเอียดของเว็บเพจนั้นๆได้หากเว็บเพจไม่มีการลง Meta Tags ไว้ Search Engine จะทำการหาคำอื่นๆ ที่อยู่ในเนื้อหาของเว็บเพจไปแสดงแทน ซึ่งอาจจะไม่ตรงกับจุดประสงค์ของเนื้อหาที่แท้จริง การใช้งาน Meta Tagsจำเป็นต้องใช้ภาษา HTML ในการเขียน จะต้องเริ่มการเขียนข้อมูลโดยใช้โค้ด <head> และปิดด้วย </head> ซึ่งมีเขตข้อมูลที่หลากหลาย โดยสามารถเลือกใช้เขตข้อมูลได้ตามความจำเป็น สำหรับเขตข้อมูลที่นิยมใช้จริง มีเพียง 3 ชุดเท่านั้น คือ
                    1.Meta tags ที่ใช้กำหนดชนิดตัวอักษร <meta http-equiv="Content-Type" content="text/html; charset="รหัสมาตรฐานภาษาที่ใช้บนเว็บ">
                   2.Meta tags ที่ใช้บอกคำที่เกี่ยวข้องกับเว็บเพจ <meta name="keywords" content="คำสำคัญคำสำคัญ">
                   3.Meta tags ที่ใช้บอกรายละเอียดของเว็บเพจ <meta name="description" content="เนื้อหาเกี่ยวกับเว็บไซต์">
          ตัวอย่าง การฝัง Meta Tag จากเว็บเพจ (MetaTags Company Inc., (2012)
<html>
     <head>
     <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
     <link rel="stylesheet" type="text/css" href="/css/style.css">
     <link rel="shortcut icon" href="/favicon.ico" type="image/x-icon">

<title>Official USA Meta tags Website | the secrets of search engines html meta tags | meta tags search engine promotion</title>
<meta name="keywords" content="meta tags, metatags, official, submit, search engine, submission, seo, internet marketing, increase traffic, promotion, web page promotions">
<meta name="description" content="Meta tags research shows that only 20% of all the web pages contain metatags and over 85% of the websites is unfit to be submitted to the search engines. Metatags.org helps you to make good meta tags">


MARC (Machine Readable Cataloging)      
          MARC ย่อมาจาก MA: Machine R: Readable C: Cataloging มีความหมายว่า การลงรายการที่เครื่องสามารถอ่านได้ MARC จึงเป็นมาตรฐานการลงรายการบรรณานุกรม การแสดงรายการทางบรรณานุกรม และข้อมูลอื่นๆ ที่เกี่ยวข้อง ที่เครื่องคอมพิวเตอร์สามารถอ่านและตีความข้อมูลในบันทึกรายการได้ ซึ่งจะเป็นการให้รายละเอียดต่างๆ ดังต่อไปนี้
1. คำอธิบายทั่วไปเกี่ยวกับสารสนเทศ ซึ่งใช้กฎในการลงรายการของ แองโกลอเมริกัน ฉบับปรับปรุงแก้ไข 2002 (Anglo-American Cataloguing Rules, 2nd ed., 2002 revision)
2. รายการหลัก และรายการเพิ่มเติม ตามหลักของ AACR2 ซึ่งจะเป็นรายการที่จะทำการเชื่อมโยงข้อมูลของการลงรายการเข้าไว้ด้วยกัน
3. หัวเรื่องโดยจะใช้การลงรายการหัวเรื่องจาก Sears List of Subject Headings (Sears) หรือ The Library of Congress Subject Headings (LCSH) หรือมาตรฐานการลงรายการหัวเรื่องอื่นๆตามความเหมาะสม
4. เลขเรียกหนังสือ โดยใช้เลขหมู่แบบทศนิยมดิวอี้ (Dewey Decimal) หรือเลขหมู่แบบหอสมุดรัฐสภาอเมริกัน (Library of Congress Classification)
          ตัวอย่าง ระเบียน MARC ของหนังสือชื่อ A tale of two cities ในเขตข้อมูล 050 082 100 245 260 และ 300 (Library of Congress, 1996)
                    050 00 |a PR4571 |b .A1 1999
                    082 00 |a 823/.8 |2 21
                    100 1_ |a Dickens, Charles, |d 1812-1870.
                    245 12 |a A tale of two cities / |c Charles Dickens.
                    260 __ |a Mineola, N.Y. : |b Dover Publications, |c c1999.
                    300 __ |a vi, 293 p. ; |c 21 cm.

ISAD(G) (General International Standard Archival Description)
          ISAD(G) ย่อมาจาก General International Standard Archival Description คือ มาตรฐานคำอธิบายจดหมายเหตุระหว่างประเทศ ซึ่งจัดทำขึ้นโดย International Council on Archives หรือ ICAเป็นระบบที่ใช้ในการทำจดหมายเหตุอิเล็กทรอนิกส์เพื่อให้หน่วยงานที่จัดทำจดหมายเหตุมีการลงรายการข้อมูล หรือคำอธิบายต่างๆ ที่ตรงกัน
          ตัวอย่าง ระเบียน ISAD(G) (ICA, 1999)
                    Reference code(s)      CA OONAD R610-134-2-E
                                                 Former Archival Reference number: RG43-A
          Title   Railway Branch correspondence, contracts, specifications, maps, plans and technical drawings and othermiscelleaneous records [textual record, cartographic material]
                    Date(s)                    1867-1936
                    Level of description    Series


CDWA (Categories for the Description of Works of Art)
          CDWA ย่อมาจาก Categories for the Description of Works of Art เป็นมาตรฐานสำหรับงานศิลปะ ที่ใช้จัดการงานพิพิธภัณฑ์ที่ถูกจัดทำขึ้นโดย The Art Information Task Force หรือ AITF ซึ่งเป็นมาตรฐานที่จัดทำโครงสร้างขึ้นมาเพื่ออธิบายข้อมูลของงานศิลปะ และงานอื่นๆ ที่เกี่ยวข้อง ที่สามารถจัดทำให้อยู่ในรูปแบบฐานข้อมูล หรือการเข้ารหัส XMLได้ เพื่อให้ข้อมูลสามารถใช้งานร่วมกันได้ เกิดความเข้าใจที่ตรงกัน สามารถเข้าถึงได้ผ่านทางเครือข่าย มีความสมบูรณ์ข้องข้อมูล และทำให้ข้อมูลสามารถใช้งานได้ยาวนาน

ภาพที่ 1 ตัวอย่าง การใช้มาตรฐาน CDWA ในการอธิบายงานศิลปะ (Baca & Harpring, 2009)


PDF Metadata
          PDF เป็นไฟล์เอกสารประเภทหนึ่งที่สร้างมาจากโปรแกรมประเภท PDF Creator โดยสามารถปรับปรุงไฟล์ให้เหมาะสมกับการใช้งานได้ง่าย อีกทั้งไฟล์ PDF สามารถแบ่งประเภทอัตโนมัติบนพื้นฐานของเมทาดาทาได้โดยไม่ต้องอาศัยการแทรกแซงของคน PDF Metadata จึงเป็นเมทาดาทาที่ให้รายละเอียดเกี่ยวกับเอกสารที่เป็นไฟล์ PDF
ภาพที่ 2 ตัวอย่าง ระเบียน PDF Metadata จาก เอกสารชื่อ Understanding Metadata


EXIF (Exchangeable image file format)
          EXIF ย่อมาจาก Exchangeable Image File Format เป็นเมทาดาทาที่ให้ข้อมูลเฉพาะเกี่ยวกับรูปถ่าย พัฒนาขึ้นโดย The Japan Electronic Industry Development Association (JEIDA) ซึ่งข้อมูลต่างๆ จะถูกบรรจุลงในภาพที่ถ่ายโดยกล้องดิจิทัล โดยให้ข้อมูลเกี่ยวกับรายละเอียดของภาพถ่ายนั้นๆ โดยให้รายละเอียด ดังนี้
-       วันและเวลาที่ถ่ายภาพ
-        คุณสมบัติของกล้องขณะที่ถ่าย (ความเร็วชัตเตอร์โหมดที่ใช้ถ่ายภาพระดับรับรู้แสง เป็นต้น)
-       ตัวอย่างภาพถ่าย
-       บันทึกข้อความ และลิขสิทธิ์
ภาพที่ 3 ตัวอย่าง ระเบียน EXIF จากภาพถ่ายกล้องดิจิทัล

XMP (Extensible Metadata Platform)
          XMP ย่อมาจาก Extensible Metadata Platform เป็นมาตรฐานการจัดเก็บข้อมูลลงในไฟล์ภาพ โดยมีหลักการคือ สามารถทำการบันทึกเมทาดาทาไว้เป็นแม่แบบ (Template) เพื่อใช้กับภาพจำนวนมากได้โดยไม่ต้องมากำหนดใหม่ทั้งหมด ยกตัวอย่าง Adobe Photoshop 7.0 ได้ตระหนักถึงความต้องการในการค้นคืนภาพ และการป้องกันลิขสิทธิ์ของภาพ จึงได้นำเทคโนโลยีเมทาดาทาระบบ XMP มาใช้ในการสร้างรายละเอียดประกอบรูปภาพ ซึ่งสนับสนุนทั้งภาษาไทยและภาษาอังกฤษ ซึ่งจะช่วยให้การค้นคืนภาพทำได้สะดวก รวดเร็ว มีประสิทธิภาพ รวมถึงสามารถอ้างอิงความเป็นเจ้าของภาพที่เผยแพร่ผ่านสื่อรูปแบบต่างๆ ได้พร้อมๆ กัน
ภาพที่ 3 ตัวอย่าง แบบแผนการลงรายการมาตรฐาน XMP จากโปรแกรม Adobe Photoshop CS3

MODS (Metadata Object Description Schema)
          MODS ย่อมาจาก Metadata Object Description Schema เป็นรูปแบบในการอธิบายข้อมูลทางบรรณานุกรมของทรัพยากรสารสนเทศดิจิทัล ที่ออกมาแบบมาเพื่อให้เข้ากับพื้นฐานรูปแบบทางบรรณานุกรมของมาร์ก ซึ่งเป็นเมทาดาทาที่พัฒนาโดย Library of Congress เพื่อให้มีมาตรฐานการลงรายการทางบรรณานุกรมที่เป็นกลางระหว่างมาร์กกับดับลินคอร์โดยใช้โครงสร้างภาษา XML ซึ่งปัจจุบัน (Version 3.4) แบ่งข้อมูลเป็น 20 ชุด ดังนี้
                   1. <titleinfo> ชื่อเรื่องหลัก หรือชื่อเรื่องอื่นๆ
                   2. <name> ชื่อผู้แต่ง ผู้สร้าง หรือผู้รับผิดชอบ
                   3. <typeOfResource> ประเภทของทรัพยากร
                   4. <genre> ลักษณะหรือรูปแบบของการนำเสนอ
                   5. <originInfo> ข้อมูลเกี่ยวกับการผลิต และการเผยแพร่
                   6. <language> ชื่อหรือรหัสของภาษาที่ใช้
                   7. <psysicalDescription> ลักษณะทางกายภาพ
                   8. <abstract> สาระสังเขป หรือเรื่องย่อ
                   9. <tableOfContents> สารบัญ
                   10. <targetAudience> กลุ่มเป้าหมายที่เหมาะสม
                   11. <note> บันทึกข้อความ หรือหมายเหตุ
                   12. <subject> หัวเรื่อง
                   13. <classification> เลขหมู่
                   14. <relatedItem> งานอื่นที่เกี่ยวข้อง
                   15. <identifier> หมายเลขระบุทรัพยากร และเลขมาตรฐาน
                   16. <location> สถานที่ที่จัดเก็บ
                   17. <accessCondition> เงื่อนไขในการเข้าถึง
                   18. <part> ส่วนที่สังกัด
                   19. <extension> ข้อมูลเพิ่มเติมอื่นๆ
                   20. <recordInfo> ข้อมูลที่จำเป็นในการจัดระเบียบทรัพยากรสารสนเทศ
          ตัวอย่าง ระเบียน MODS ของบทความ Hiring and recruitment practices in academic libraries (Library of Congress, 2011)
          <titleInfo>
               <title>Hiring and recruitment practices in academic libraries</title>
          </titleInfo>
          <name type="personal">
               <namePart>Raschke, Gregory K.</namePart>
               <displayForm>Gregory K. Raschke</displayForm>
          </name>
          <typeOfResource>text</typeOfResource>
          <genre>journal article</genre>

Crosswalk Metadata
          Crosswalk Metadata คือ การทำเมทาดาทาที่มีมากกว่า 1 แบบ เรียกได้ว่าเป็นลักษณะของการข้ามผ่านจากข้อมูลชุดหนึ่งไปยังข้อมูลอีกชุดหนึ่ง โดยการเชื่อมโยงข้อมูลระหว่างเมทาดาทาแบบหนึ่งไปยังอีกแบบหนึ่งโดยจะอนุญาตให้สร้างกลุ่มขึ้นมา และจะสามารถใช้ได้กับกลุ่มอื่นๆ ที่ใช้มาตรฐานเมทาดาทาที่แตกต่างกัน ทำให้หน่วยงานที่ใช้เมทาดาทาต่างกันสามารถปรับใช้ข้อมูลร่วมกับ             เมทาดาทาอื่นได้ จึงเป็นสิ่งจำเป็นสำหรับห้องสมุดดิจิทัล ที่มีทรัพยากรที่รวบรวมมาจากหลายๆ แหล่ง

หน่วยข้อมูล
Dublin Core
EAD
MARC21
Title element
Title
<titleproper>
245 $a Title statement/Title proper)
Author element
Creator
<author>
100, 110,111,700, 710, 711Personal name, added entry ,personal name, Corporate name, added entry-corporate name
Date created element
Date.Created
<unitdate>
260 $c Date of publication
ตารางที่ 1 ตัวอย่าง Crosswalk ของ Dublin Core, EAD และ MARC21 (STKS, 2553)


รวมลิงก์ที่น่าสนใจเกี่ยวกับ Metadata





เรียนรู้เกี่ยวกับ Marc21

MARC21

ที่มาของ MARC 21 มาจากการประกาศของหอสมุดรัฐสภาอเมริกันและหอสมุดแห่งชาติแคนาดา ที่จะทำการรวมรูปแบบของ USMARC และ CAN/MARC เข้าด้วยกัน  เพราะเห็นว่ามีรูปแบบที่เหมือนและคล้ายคลึงกันจึงทำการผสมผสานรูปแบบของ MARC ทั้งสองเข้าด้วยกัน แล้วตั้งชื่อให้ใหม่ว่า MARC 21 (คล้ายกับเป็นหนังสือชื่อเรื่องเดิม แต่ Edition ฉบับปรับปรุง ประมาณนี้) ส่วนคำว่า 21 ก็มาจากที่ต้องการจะบอกว่าการไปสู่ศตวรรษที่ 21 เพราะ MARC 21 ได้ Update เสร็จสิ้นประมาณปี ค.ศ.1997-1998
ครอบครัวของ MARC 21 มี 5 รูปแบบ คือ
          1. Bibliographic Format 
          2. Holding Format
          3. Classification Format
          4. Authority Format
         5. Community Format
     ลักษณะ ของ MARC 21 ที่พิเศษ คือ มีการกำหนดรูปแบบให้เป็นไปตามมาตรฐานที่เรียกว่า ANSI/NISO Z39.2 มาตรฐานการแลกเปลี่ยนข้อมูลบรรณานุกรม (Bibliographic Information Interchange) และ ISO 2709 รูปแบบการแลกเปลี่ยนข้อมูล (Format for Information Exchange) เพื่อช่วยให้ผู้ใช้ที่ใช้ software ห้องสมุดที่แตกต่างกัน สามารถสื่อสาร แลกเปลี่ยน และเข้าถึงข้อมูลกันได้มากขึ้น นอกจากนี้ MARC 21 ยังสามารถรองรับการทำงานระบบหลายภาษาได้ด้วย
         สรุป MARC 21 ไม่ใช่รูปแบบของ MARC ใหม่ แต่เป็น edition ที่ปรับปรุงมาจาก USMARC ผสมผสานกับ CAN/MARC นั่นเอง
Marc  คือ การลงรายการที่เครื่องอ่านได้ ส่วนประกอบของ MARC21 มี 3 ส่วน คือ 1. หมายเลขเขตข้อมูล (Tag number) 2. ตัวบ่งชี้ (Indicator)  3. รหัสเขตข้อมูลย่อย (Subfield code)
          หมายเลขเขตข้อมูล  (Tag number) ได้แก่ 0XX – 8XX ส่วน 9XX คือนอกเหนือจากที่ MARC Tag ที่กำหนดมา
          หน้าที่ของแต่ละ มีความแตกต่างกันไป อย่างTag 0XX เกี่ยวกับการควบคุมและการระบุเลขเรียกหนังสือ  1XX รายการหลัก 2XX ชื่อเรื่อง การแจ้งความรับผิดชอบ ฉบับพิมพ์ การพิมพ์ ฯลฯ  3XXลักษณะรูปร่าง 4XX ชื่อชุด (Tag 490 ใช้คู่กับ 830 เสมอ) 5XX หมายเหตุ 6XX หัวเรื่อง 7XX รายการเพิ่ม 8XX เพิ่มชื่อชุด
ให้สังเกต ถ้าลงท้ายด้วย X00 เช่น 100 600 700 จะใช้กับชื่อบุคคล   ลงท้ายด้วย X10 เช่น 110 610 710 จะใช้กับนิติบุคคล  ลงท้ายด้วย X11 ใช้กับชื่อการประชุม สัมมนา เช่น 111 611 711 ถ้าลงท้ายด้วย X30 ใช้กับชื่อเรื่องแบบฉบับ เช่น 130 630 730
ตัวบ่งชี้ (Indicator)  รหัส 2 ตัว มีค่า 0-9 ส่วนเว้นว่าง (blank)
รหัสเขตข้อมูลย่อย (Subfield code) ที่เราเรียกว่า Subfield สามารถใช้เครื่องหมาย |  $  และ ^

มาตรฐานการลงรายการตามรูปแบบ MARC 21
          โครงสร้างมาตรฐานการลงรายการระเบียนบรรณานุกรมรูปแบบ MARC 21 สำหรับ
หนังสือที่อ่านได้ด้วยเครื่องคอมพิวเตอร์นั้น จะลงรายการเก็บไว้ในฐานข้อมูล โดยมีโครงสร้างมาตรฐานสำหรับลงรายการระเบียนบรรณานุกรมรูปแบบมาร์ก 21 (MARC 21 Concise Format for Bibliographic Data. Update No. 7, 2006;MARC 21 Format for Bibliographic Data : Including guidelines for content designation, 1999)ซึ่งต่างก็ยึดหลักเกณฑ์การลงรายการต่าง ๆ ตามกฏAACR2R ซึ่งได้กล่าวมาแล้วก่อนหน้านี้ซึ่งโครงสร้างระเบียนบรรณานุกรม ประกอบด้วยส่วนต่าง ๆ 3 ส่วนหลักคือ
            1. ส่วนนำระเบียน หรือป้ายระเบียน (Leader or Record Label) เป็นเขตข้อมูลเริ่มแรก
ของระเบียนบรรณานุกรมทุกระเบียน ให้ข้อมูลในการประมวลผลระเบียน ลักษณะของข้อมูลเป็น
คำรหัสทั้งที่เป็นตัวเลขและตัวอักษร (ตัวพิมพ์เล็ก) และสัญลักษณ์แบบใดแบบหนึ่ง หรือเว้นว่าง
มีความยาวคงที่ 24 ตำแหน่ง (ตำแหน่งที่ 00-23) โดยข้อมูลในแต่ละตำแหน่งจะเป็นสิ่งบ่งบอกถึง
คุณลักษณะของระเบียนนั้น ๆ นอกจากนั้น คำรหัสเหล่านี้ช่วยให้คอมพิวเตอร์สามารถอ่าน และ
นำไปประมวลผลรายการต่อไปได้ ตำแหน่งต่าง ๆ ในส่วนนำระเบียน ได้แก่
                00-04 ความยาวของระเบียน (Logical Record Length) คอมพิวเตอร์จัดการให้
                05 สถานะของระเบียน (Record status)
                06 ประเภทของระเบียน (Type of Record)
                07 ระดับทางบรรณานุกรม (Bibliographic Level)
                08 รูปแบบการควบคุม (Type of Control)
                09 แบบตัวอักษร (Character Coding Scheme)
               10 จำนวนตัวบ่งชี้ (Indicator count) เป็น “2” เสมอ
               11 จำนวนรหัสเขตข้อมูลย่อย (Subfield Code Count) เป็น “2” เสมอ
               12-16 ตำแหน่งเริ่มต้นของเขตข้อมูล (Base Address of Data) คอมพิวเตอร์จัดการให้
               17 ระดับการลงรายการ (Encoding Level)
               18 รูปแบบการลงรายการ (Descriptive Cataloging Form)
               19 การเชื่อมโยงระเบียน (Linked Record Requirement)
               20 ความยาวของส่วนระบุความยาวของเขตข้อมูล (Length of the Length-of-field
                    Portion) เป็น “4” เสมอ
               21 ความยาวของส่วนระบุตำแหน่งที่เริ่มต้น (Length of the Starting-characterposition
                    Portion) เป็น “5” เสมอ
               22 ความยาวส่วนระบุแต่ละหน่วยข้อมูล (Length of the Implementation-defined
                     Portion) เป็น “0” เสมอ
               23 ยังไม่กำหนดให้ใช้ (Undefined) เป็น “0” เสมอ
          2. ส่วนนามานุกรมเขตข้อมูล (Directory) เป็นเขตที่สองของระเบียน เป็นส่วนที่บอกให้
ทราบถึงตำแหน่งที่อยู่ของเขตข้อมูลต่าง ๆ ที่จัดเก็บในระเบียน ประกอบด้วยชุดของตัวเลขในแต่ละชุดมีความยาวคงที่ 12 ตำแหน่ง โดย 3 ตำแหน่งแรกเป็นเขตข้อมูล (Tag) 4 ตำแหน่งถัดไปเป็นความยาวของเขตข้อมูล และ 5 ตำแหน่งสุดท้ายเป็นตำแหน่งแรกที่บันทึกข้อมูลของเขตข้อมูลนั้น ๆ เครื่องคอมพิวเตอร์จะจัดลำดับเขตข้อมูลของแต่ละระเบียน โดยเริ่มต้นด้วยเขตข้อมูลความยาวคงที่ตามด้วยเขตข้อมูลความยาวไม่คงที่ จากเลขน้อยไปหามาก โดยเริ่มจากเขตข้อมูล 010ถึง 999 ไปตามลำดับ ทั้งนี้ ในแต่ละระเบียนอาจมีจำนวนเขตข้อมูลมากน้อยไม่เท่ากัน ขึ้นอยู่กับรายละเอียดของหนังสือแต่ละเล่ม ตัวอย่างการจัดเรียงตัวเลขในส่วนนามานุกรมเขตข้อมูล 100  จะเป็นดังนี้  100001500093
               100       หมายถึงเขตข้อมูล (Tag)
               0015     หมายถึงความยาวของเขตข้อมูลซึ่งยาว 15 อักขระ
               00093   หมายถึงตำแหน่งแรกที่บันทึกข้อมูลในเขตข้อมูล 100
              จากตัวอย่างดังกล่าวหมายความว่า เขตข้อมูล 100 มีจำนวนอักขระประกอบกัน 15
อักขระ โดยเริ่มบันทึกข้อมูลในตำแหน่งที่ 92 (เริ่มนับตำแหน่งตั้งแต่เขตข้อมูลความยาวคงที่ โดยที่
ตำแหน่งแรกจะนับเป็น 0 และนับต่อไปเรื่อย ๆ จนจบข้อมูลในระเบียน)
           3. ส่วนเขตข้อมูลต่าง ๆ (Variable Fields) ใช้บันทึกข้อมูลบรรณานุกรมของวัสดุเหมือนกับที่บันทึกลงบนบัตรรายการ ในแต่ละเขตข้อมูลจะกำกับด้วยส่วนต่าง ๆ คือ
              3.1 เขตข้อมูล (Tag) เป็นหมายเลขประจำเขตข้อมูล โดยใช้เลข 3 หลัก เริ่มต้นจาก 001 ถึง 999 แทนชื่อเขตข้อมูลต่าง ๆ เช่น เขตข้อมูล 100 คือ ชื่อผู้แต่ง, เขตข้อมูล 245 คือ ชื่อเรื่อง
เป็นต้น
             3.2 ตัวบ่งชี้ (Indicator) เป็นรหัสที่ใช้อักขระ 2 ตำแหน่ง ตามหลังเขตข้อมูล ในเขตข้อมูลความยาวไม่คงที่ ทำหน้าที่บอกลักษณะ หรือเพิ่มเติมรายละเอียด และที่มาของข้อมูลในเขตข้อมูลที่ตัวบ่งชี้นั้นกำกับอยู่ ค่ารหัสของตัวบ่งชี้ในแต่ละเขตข้อมูลมีความหมายแตกต่างกันไปตามลักษณะของข้อมูล รหัสของตัวบ่งชี้เป็นได้ทั้งตัวเลข (0-9) แต่ถ้าตำแหน่งใดที่ยังไม่กำหนดให้ใช้จะเป็นค่าว่าง ซึ่งอาจใช้วิธีการเว้นว่าง หรือแทนด้วยสัญลักษณ์แบบใดแบบหนึ่ง เช่น # หรือ เป็นต้น ในขณะเดียวกันบางเขตข้อมูลอาจไม่กำหนดให้ใช้ตัวบ่งชี้ เช่น เขตข้อมูล 250 รหัสตัวบ่งชี้เป็นค่าว่าง และบางเขตข้อมูลกำหนดให้ใช้ตัวบ่งชี้ทั้ง 2 ตำแหน่ง เช่น ในเขตข้อมูล 245 เป็นต้น
              3.3 รหัสเขตข้อมูลย่อย เป็นรหัสที่ใช้กำกับเขตข้อมูลย่อย ในเขตข้อมูลหนึ่งๆ ทำหน้าที่จัดกลุ่ม หรือจำแนกข้อมูลให้เป็นเขตข้อมูลย่อยๆ เพื่อประโยชน์ในการจัดเก็บและค้นคืนสารสนเทศได้อย่างมีประสิทธิภาพ สัญลักษณ์ของรหัสเขตข้อมูลย่อย ประกอบด้วยอักขระ ตำแหน่ง โดยตำแหน่งแรกเป็นเครื่องหมาย หรือสัญลักษณ์แบบใดแบบหนึ่ง เช่น | , \ , ^ หรือ เป็นต้น 
        ส่วนตำแหน่งที่สองเป็นอักษร (ตัวพิมพ์เล็ก) หรือตัวเลข ในส่วนเขตข้อมูลต่างๆ นี้แบ่งกลุ่มเขตข้อมูลออกเป็น 2 กลุ่มคือ
                 1. เขตข้อมูลควบคุม (Variable Control Field) คือเขตข้อมูลที่บันทึกหมายเลขควบคุม
ระเบียน ซึ่งเป็นทั้งข้อมูลในรูปแบบตัวเลข และรหัสที่บอกลักษณะของวัสดุสารสนเทศ เพื่อใช้สำหรับการประมวลผลระเบียนบรรณานุกรม เป็นเขตข้อมูลที่เริ่มจากเขตข้อมูล 001 ถึง 009 ซึ่งบางเขตข้อมูลเป็นเขตข้อมูลความยาวคงที่ (Fixed Field) เช่น เขตข้อมูล 007 และ 008 เป็นต้นสำหรับเขตข้อมูล 008 เป็นเขตข้อมูลที่มีความสำคัญต่อการลงรายการหนังสือและสื่ออื่นๆซึ่งมีความแตกต่างกันในแต่ละตำแหน่งตามลักษณะเฉพาะของสื่อนั้น ๆ เขตข้อมูลนี้บันทึกอยู่ในรูปรหัสมีความยาวคงที่ 40 ตำแหน่ง (00-39) ค่ารหัสเป็นได้ทั้งตัวเลข ตัวอักษร (ตัวพิมพ์เล็ก)และเว้นว่าง ซึ่งอาจแทนด้วยสัญลักษณ์แบบใดแบบหนึ่ง ไม่มีตัวบ่งชี้ และรหัสเขตข้อมูลย่อยการบันทึกค่ารหัสในเขตข้อมูล 008 ในตำแหน่งที่ 00-17 และ 35-39 กำหนดให้ใช้ได้กับสื่อทุกประเภท ส่วนตำแหน่งที่ 18-34 จะกำหนดขึ้นเฉพาะของสื่อแต่ละประเภท โดยปกติการบันทึกข้อมูลในเขตข้อมูล 008 เกือบจะทุกตำแหน่งจะต้องสัมพันธ์กับข้อมูลในเขตข้อมูลความยาวไม่คงที่และระบบได้นำข้อมูลที่เป็นรหัสเหล่านี้ไปใช้ประโยชน์ในหลายรูปแบบ ได้แก่ การแสดงผลที่หน้าจอ การจัดลำดับรายการ และใช้เป็นเงื่อนไขในการจำกัดขอบเขตผลการสืบค้น เช่น ภาษา หรือปีที่พิมพ์ เป็นต้น ตำแหน่งต่าง ๆ ในเขตข้อมูล 008 สำหรับการลงรายการหนังสือ มีดังนี้
                      00-05 วันเดือนปีที่บันทึกข้อมูล (Date Entered on File (YYMMDD))
                      06 ประเภทของปีพิมพ์ (Type of Date/ Publication Status)
                      07-10 ปีพิมพ์เริ่มต้น (Date 1/ Beginning Date of Publication)
                      11-14 ปีพิมพ์สิ้นสุด (Date 2/ Ending Date of Publication)
                      15-17 สถานที่พิมพ์ ที่ผลิตหรือที่จัดทำ (Place of Publication, Production)
                      18-21 ภาพประกอบ (Illustrations)
                      22 กลุ่มผู้ใช้ (Target Audience)
                      23 รูปแบบของวัสดุ (Form of Item)
                      24-27 ลักษณะเนื้อหา (Nature of Contents)
                      28 สิ่งพิมพ์รัฐบาล (Government Publication)
                      29 เอกสารการประชุม (Conference Publication)
                      30 หนังสือที่ระลึก (Festschrift)
                      31 ดรรชนี (Index)
                      32 ยังไม่กำหนดให้ใช้ (Undefined)
                     33 รูปแบบวรรณกรรม (Literary Form)
                     34 ชีวประวัติ (Biography)
                     35-37 ภาษา (Language)
                     38 ระเบียนที่มีการแก้ไข (Modified Record)
                     39 แหล่งที่ทำการวิเคราะห์ (Cataloging Source)
                2. เขตข้อมูลความยาวไม่คงที่ (Variable Data Field) คือส่วนของเขตข้อมูลต่าง ๆ ที่เป็น
การบันทึกรายละเอียดทางบรรณานุกรมเช่นเดียวกับข้อมูลที่บันทึกบนบัตรรายการโดยเริ่มจากเขตข้อมูล 010 ถึง 999 มีความยาวไม่คงที่ บันทึกข้อมูลที่เป็นทั้งตัวเลขและตัวอักษร โดยไม่จำกัดความยาว เขตข้อมูลเหล่านี้มีตัวบ่งชี้และรหัสเขตข้อมูลย่อย(Tag)(ซึ่งถ้ามีการซ้ำของเขตข้อมูลจะใช้(R= Repeatable) ต่อท้าย หมายถึง สามารถใช้เขตข้อมูล (Tag) หรือรหัสเขตข้อมูลย่อยนั้นซ้ำได้
เช่น ในระเบียนหนึ่ง มีโน้ตได้หลายรายการ นั่นคือใช้เขตข้อมูล 500 ซ้ำได้ และถ้ามี (NR =
Non Repeatable) ต่อท้าย หมายถึง สามารถใช้เขตข้อมูล หรือรหัสเขตข้อมูลย่อยนั้นได้เพียงครั้ง
เดียว เช่น ในระเบียนหนึ่งมีชื่อผู้แต่งได้เพียงคนเดียว นั่นคือใช้เขตข้อมูล 100 ซ้ำไม่ได้) เขตข้อมูลที่
ใช้เป็นประจำในการลงรายการของหนังสือตามรูปแบบมาร์ก ได้แก่
                    เขตข้อมูล: 020 เลขมาตรฐานสากลประจำหนังสือ (R) เขตข้อมูลนี้อยู่ในระดับ A
                     ตัวบ่งชี้: # – - ยังไม่กำหนดให้ใช้
                     รหัสเขตข้อมูลย่อย: $a – - เลขมาตรฐานสากลประจำหนังสือ (R)
                                                  $c – - ข้อมูลเกี่ยวกับการได้มา (ส่วนใหญ่เป็นราคา)(NR)
                                                  $z – - เลขมาตรฐานสากลประจำหนังสือที่ยกเลิก
                     หรือไม่ถูกต้อง (R)
                     หมายเหตุ ให้ใช้ Uppercase X สำหรับเป็นเลขอารบิคตัวที่ 10
                     เขตข้อมูล : 022 เลขมาตรฐานสากลสำหรับวารสาร (R) [เขตข้อมูลนี้อยู่ในระดับ A]
                      ตัวบ่งชี้: # – - ยังไม่กำหนดให้ใช้
                      รหัสเขตข้อมูลย่อย: $a – - เลขมาตรฐานสากลประจำวารสาร (R)
                                                   $y – - เลขมาตรฐานสากลประจำวารสารที่
                                                  ไม่ถูกต้อง (R)
                     หมายเหตุ ให้ใช้กรณีที่ห้องสมุดต้องการจัดเก็บเป็นหนังสือให้สร้างระเบียนข้อมูล