În articolul de astăzi vom vorbi despre metadate, vom afla ce înseamnă asta, la ce sunt folosite și de ce. Așadar, fără alte adăugiri, să începem! 😊
Ce înseamnă metadate?
Adesea denumite date care descriu alte date, metadatele sunt date de referință structurate care ajută la sortarea și identificarea atributelor informațiilor pe care le descriu. În Zen and the Art of Metadata Maintenance, John W. Warren le descrie ca fiind „atât un univers, cât și ADN”.
Meta este un prefix care – în majoritatea utilizărilor din domeniul tehnologiei informației – înseamnă „o definiție sau o descriere subiacentă”. Metadatele rezumă informațiile de bază despre date, ceea ce poate facilita găsirea, utilizarea și reutilizarea anumitor instanțe de date.
De exemplu, autorul, data creării, data modificării și dimensiunea fișierului sunt exemple de bază ale unui fișier document. Posibilitatea de a căuta un anumit element (sau elemente) din aceste metadate facilitează mult localizarea unui anumit document.
Pe lângă fișierele de documente, sunt utilizate pentru:
fișiere de calculator
imagini
baze de date relaționale
foi de calcul
videoclipuri
fișiere audio
pagini web
Utilizarea lor pe paginile web poate fi foarte importantă. Metadatele conțin descrieri ale conținutului paginii, precum și cuvinte cheie legate de conținut. Acestea sunt adesea afișate în rezultatele căutărilor de către motoarele de căutare, ceea ce înseamnă că acuratețea și detaliile lor ar putea influența decizia unui utilizator de a vizita sau nu un site. Aceste informații sunt de obicei exprimate sub formă de metaetichete.
Motoarele de căutare evaluează metaetichetele pentru a decide cu privire la relevanța unei pagini web. Până la sfârșitul anilor 1990, metaetichetele au fost folosite ca factor cheie în determinarea poziției într-o căutare. Creșterea gradului de optimizare a motoarelor de căutare (SEO) spre sfârșitul anilor ’90 a determinat multe site-uri web să își umple de cuvinte cheie metadatele pentru a păcăli motoarele de căutare, făcând ca site-urile lor să pară mai relevante decât altele.
De atunci, motoarele de căutare și-au redus încrederea în metaetichete, deși acestea sunt încă luate în considerare la indexarea paginilor. Multe motoare de căutare încearcă, de asemenea, să contracareze capacitatea paginilor web de a înșela sistemul lor prin modificarea regulată a criteriilor de clasificare, Google fiind cunoscut pentru că își schimbă frecvent algoritmii de clasificare.
Acestea pot fi create manual sau prin procesarea automată a informațiilor. Crearea manuală tinde să fie mai precisă, permițând utilizatorului să introducă orice informație pe care o consideră relevantă sau care ar ajuta la descrierea fișierului. Crearea automată a metadatelor poate fi mult mai elementară, afișând de obicei doar informații precum dimensiunea fișierului, extensia fișierului, data la care a fost creat fișierul și cine l-a creat.
Cazuri de utilizare a metadatelor
Metadatele sunt create în orice moment în care un document, un fișier sau un alt activ informațional este modificat, inclusiv prin ștergerea acestuia. Metadatele precise pot fi utile pentru a prelungi durata de viață a datelor existente, ajutând utilizatorii să găsească noi modalități de aplicare a acestora.
Ele organizează un obiect de date prin utilizarea unor termeni asociați cu acel obiect. De asemenea, acestea permit identificarea obiectelor care nu sunt similare și asocierea lor cu obiecte similare pentru a ajuta la optimizarea utilizării activelor de date. După cum am menționat, motoarele de căutare și browserele determină ce conținut web trebuie afișat prin interpretarea etichetelor de metadate asociate unui document HTML.
Limbajul metadatelor este scris astfel încât să fie inteligibil atât pentru sistemele informatice, cât și pentru oameni, un nivel de standardizare care contribuie la o mai bună interoperabilitate și integrare între aplicații și sisteme informatice disparate.
Companiile din domeniul editării digitale, al ingineriei, al serviciilor financiare, al asistenței medicale și al producției folosesc metadatele pentru a aduna informații despre modalitățile de îmbunătățire a produselor sau de modernizare a proceselor. De exemplu, furnizorii de conținut de streaming automatizează gestionarea metadatelor de proprietate intelectuală, astfel încât acestea să poată fi stocate într-o serie de aplicații, protejând astfel deținătorii de drepturi de autor și, în același timp, făcând ca muzica și videoclipurile să fie accesibile utilizatorilor autentificați.
Maturitatea tehnologiilor de inteligență artificială ușurează oarecum povara tradițională a gestionării metadatelor, prin automatizarea proceselor anterior manuale de catalogare și etichetare a activelor informaționale.
Istoria și originile metadatelor
Jack E. Myers, fondatorul Metadata Information Partners (în prezent The Metadata Co.), susține că a inventat termenul în 1969. Myers a depus o marcă comercială pentru cuvântul „metadate” fără cratimă în 1986. În ciuda acestui fapt, referiri la acest termen apar în lucrări academice anterioare afirmației lui Myers.
Într-o lucrare academică publicată în 1967, profesorii David Griffel și Stuart McIntosh de la Massachusetts Institute of Technology au descris metadatele ca fiind „o înregistrare … a înregistrărilor de date” care rezultă atunci când datele bibliografice despre un subiect sunt adunate din surse discrete. Cercetătorii au concluzionat că este necesară o „abordare meta-lingvistică” pentru a permite unui sistem informatic să interpreteze în mod corespunzător aceste date și contextul lor în raport cu alte date relevante. Spre deosebire de Myers, Griffel și McIntosh au tratat „meta” ca pe un prefix la „date”.
În 1964, un student la licență în informatică, pe nume Philip R. Bagley, a început să lucreze la teza sa de doctorat, în care susținea că eforturile de a „face elemente de date compozite” se bazează în cele din urmă pe capacitatea de a „asocia în mod explicit” un al doilea element de date conex, pe care „l-am putea numi un „element de metadate””. Deși teza sa a fost respinsă, lucrarea lui Bagley, inclusiv referirea sa la metadate, a fost publicată ulterior sub forma unui raport în cadrul unui contract cu U.S. Air Force Office of Scientific Research în ianuarie 1969.
Cum să utilizăm eficient metadatele
Ritmul accelerat de creștere al volumului de date a alimentat un nou interes față de potențiala valoare comercială care poate fi obținută din metadate. Există o varietate de structuri de date care prezintă atât oportunități, cât și provocări.
Gestionarea lor oferă un cadru organizațional pentru a armoniza seturile de date discrete stocate în diverse sisteme. De asemenea, oferă un consens organizațional pentru a descrie informațiile, adesea împărțite în date de afaceri, operaționale și tehnice.
Companiile implementează managementul metadatelor pentru a elimina datele mai vechi și pentru a dezvolta o taxonomie pentru a clasifica datele în funcție de valoarea lor comercială. O componentă a acestui proces este un catalog sau o bază de date centrală care servește drept depozit de metadate, cunoscută și sub numele de dicționar de date.
Pe lângă clasificarea datelor, strategiile de gestionare a metadatelor sunt utilizate pentru a îmbunătăți analiza datelor, pentru a dezvolta o politică de guvernanță a datelor și pentru a stabili o pistă de audit pentru respectarea reglementărilor.
În esență, gestionarea metadatelor constă în a le permite oamenilor să identifice atributele unei anumite bucăți de date utilizând o interfață de utilizator bazată pe web. Atributul poate fi numele fișierului, autorul acestuia, un număr de identificare a clientului și așa mai departe. Persoana care solicită documentul poate astfel să vadă și să înțeleagă diferitele atribute ale datelor, sistemul întreprinderii în care se află și motivele pentru care au fost create aceste atribute.
Standardizarea metadatelor
Au fost elaborate o serie de standarde industriale pentru a face metadatele mai utile. Aceste standarde asigură consecvența în ceea ce privește limbajul comun, formatul, ortografia și alte atribute care trebuie utilizate pentru a descrie datele. Fiecare standard se bazează pe o schemă specifică care oferă o structură globală pentru toate metadatele sale.
Dublin Core este un standard general utilizat pe scară largă, dezvoltat inițial pentru a ajuta la indexarea cataloagelor de cărți de bibliotecă fizice. De atunci, standardul a fost adaptat pentru metadatele digitale bazate pe web. Dublin Core descrie atributele a 15 elemente de date de bază: titlu, creator, subiect, descriere, editor, colaboratori, dată, tip, format, identificator, sursă, limbă, relație, acoperire și gestionarea drepturilor.
Un standard mai nou, schema.org, se bazează pe colaborarea de software cu sursă deschisă care oferă o colecție de scheme de metadate orientate spre datele structurate de pe internet, e-mail și alte forme de date digitale.
Acesta a fost articolul de astăzi! Dacă ți-a plăcut, nu uita să arunci un ochi peste blog-ul nostru pentru mai multe articole interesante, în special pe categoria Web-ul în 100 de pași! De asemenea, ne găsești și pe TikTok, și pe Instagram!
0 Comentarii