Linguaggio di markupUn linguaggio di markup (in italiano linguaggio di marcatura o linguaggio di formattazione) è un insieme di regole che descrivono i meccanismi di rappresentazione (strutturali, semantici, presentazionali) o d'impaginazione di un testo; facendo uso di convenzioni rese standard, tali regole sono utilizzabili su più supporti. Perciò, la tecnica di formattazione con marcatori (detti espressioni codificate) richiederà una serie di convenzioni, proprie appunto di un linguaggio a marcatori di documenti. DescrizioneIl termine markup (o marcatura) deriva dall'ambiente tipografico dove si usava contrassegnare con annotazioni le parti del testo che andavano evidenziate o corrette, allo scopo di segnalarle al compositore o al dattilografo. TipologieI diversi linguaggi di markup esistenti si distinguono fondamentalmente in:
La differenza tra i due sta nel meccanismo usato per definire la rappresentazione del testo, sia per quanto riguarda la sua struttura, sia per quanto riguarda il significato degli elementi che lo compongono, sia per quanto riguarda la visualizzazione (o formattazione):
I linguaggi del secondo tipo si concentrano sui problemi strutturali di leggibilità e prescindono in fase di lettura dal software con cui sono stati generati. Sono, in altre parole, quelli che permettono di garantire separazione tra struttura (o contenuto) e visualizzazione (o presentazione, non necessariamente visuale: ad esempio, parlata). L'SGML (Standard Generalized Markup Language) è stato il primo metalinguaggio di markup descrittivo standardizzato a livello internazionale (ISO 8879 del 1986) che ha definito dei metodi di rappresentazione del testo in forma elettronica in modo indipendente dall'hardware e dal sistema operativo utilizzato. L'SGML è basato sul concetto di definizione del tipo di documento o Document Type Definition (DTD) ovvero richiede per ogni documento la definizione del modo in cui i vari elementi del testo possono essere utilizzati. Ad esempio una lettera contiene degli elementi essenziali quali mittente, uno o più destinatari, data, oggetto, corpo, l'indicazione di colui che la firma, .... Tutti elementi che devono essere presenti, probabilmente anche con un certo ordine. La DTD deve prendersi carico di definire tutto questo, stabilendo ciò che è permesso e cosa invece non lo è. L'HTML è stato sviluppato nei primissimi anni novanta del XX secolo da Tim Berners-Lee al CERN di Ginevra (Svizzera), assieme al protocollo HTTP dedicato al trasferimento di documenti in tale formato. Nel 1989 Berners-Lee propose un progetto che riguardava la pubblicazione di ipertesti, noto con il nome di "world wide web". All'interno di questo progetto in seguito nacquero sia il server web "httpd" (HyperText Transfer Protocol Daemon), sia il client WorldWideWeb (il primo browser della storia), il cui sviluppo partì nell'ottobre del 1990, e il cui uso fu esclusivamente interno al CERN fino alla sua pubblicazione nella rete internet nel corso del 1991. Assistito dai suoi colleghi all'interno dell'istituto Svizzero, Berners-Lee concorse alla definizione della prima versione dell'HTML, che fu ufficialmente resa pubblica nel giugno del 1993, co-firmata insieme a Daniel Connolly e sostenuta dal gruppo di lavoro dell'Internet Engineering Task Force (IETF) chiamato Integration of Internet Information Resources ("Integrazione delle risorse informative di Internet"), per proporla come standard IETF. Nel 1994 il linguaggio ha avuto una forte diffusione in seguito ai primi utilizzi commerciali del web, così nello stesso anno nacque il World Wide Web Consortium, e da quel momento in poi, lo sviluppo dell'HTML diverrà prerogativa del W3C. Nel 1995 il W3C definì la versione 3.0 di HTML, a cui seguì la versione 3.2 nel 1997, e infine arrivarono nel 1998 le prime specifiche di HTML4. Caratteristiche dei linguaggi di markupUna caratteristica comune di molti linguaggi di markup è che mescolano il testo di un documento con le istruzioni di markup nello stesso flusso di dati o file. Questo non è necessario; è possibile isolare il markup dal contenuto del testo, utilizzando puntatori, offset, ID o altri metodi per coordinare i due. Tale "markup standoff" è tipico per le rappresentazioni interne che i programmi utilizzano per lavorare con i documenti contrassegnati. Tuttavia, il markup incorporato o "inline" è molto più comune altrove. Ecco, ad esempio, una piccola sezione di testo contrassegnata in HTML: <h1>Anatidi</h1> <p> La famiglia <i>Anatidi</i> comprende anatre, oche e cigni, ma <em>non</em> gli urlatori strettamente imparentati. </p> I codici racchiusi tra parentesi angolari Al contrario, il tag La Text Encoding Initiative (TEI) ha pubblicato ampie linee guida[2] su come codificare testi di interesse per le scienze umane e sociali, sviluppate in anni di lavoro di cooperazione internazionale. Queste linee guida sono utilizzate da progetti che codificano documenti storici, opere di studiosi, periodi o generi particolari e così via. Note
Voci correlateLinguaggi della famiglia SGMLLinguaggi della famiglia XML
Linguaggi leggeri
Altri linguaggi
Altre voci correlateAltri progetti
Collegamenti esterni
|