Il linguaggio HTML

La rapida espansione della rete Internet e del numero degli utenti ha comportato in pochi anni l'aumento dei siti raggiungibili e della quantità di informazioni disponibili. La moderna tecnologia software mette a disposizione numerosi strumenti per realizzare con facilità pagine Web (solitamente create in formato HTML, HyperText Markup Language), cioè pronte per essere registrate su un server Internet e visualizzabili con un browser dagli utenti che si collegano. Attualmente tutti gli ISP (Internet Service Provider), oltre alla connettività Internet, offrono la possibilità di ospitare presso la propria infrastruttura tecnologica pagine Web secondo le particolari esigenze dell'utente, sia esso privato o azienda.

L'insieme organizzato di pagine tra loro collegate che si riferiscono ad uno stesso utente, ad uno stesso argomento o azienda forma un sito Internet o sito Web.

Un sito può contenere pagine con brevi presentazioni, oppure informazioni, immagini oltre a tutti gli altri oggetti multimediali, quali suoni, animazioni o filmati. Per preparare pagine Web basta un normale personal computer con le caratteristiche minime necessarie a trattare documenti multimediali: processore veloce, memoria RAM con un minimo di 128 Mb, disco fisso con la capacità di qualche Gb. Le pagine, una volta completate e verificate nel funzionamento, devono essere trasferite sul server dove si trova il sito e spesso devono essere modificate o aggiornate in momenti successivi.

Le pagine da pubblicare su Internet sono realizzate usando il linguaggio HTML (HyperText Markup Language) e sono interpretate poi da un programma browser per essere visualizzate in forma grafica sul video dell'utente.

Il codice HTML può essere interpretato da un browser Internet e riproposto sia in forma grafica che testuale. Utilizzando specifiche tecnologie può inoltre essere interpretato e riproposto come output anche attraverso sintesi vocale o rendering tattile. Per rendere facile la produzione di pagine, occorre un software che consenta all'utente di predisporre le pagine in modo visuale e che generi in modo automatico il codice HTML: un prodotto software con queste funzioni si chiama Web editor (es. MS FrontPage, Macromedia Dreamweaver).

L'uso di un Web editor presuppone la disponibilità di un programma browser, per verificare la corretta visualizzazione delle pagine.
Per il trasferimento (upload) dei file contenenti le pagine, dal disco del proprio computer al server Internet dove devono essere pubblicate, si usa un programma di FTP (File Transfer Protocol). Ovviamente per effettuare questa operazione l'utente deve possedere il permesso di accesso (account) al server Internet di pubblicazione, tramite un nome di identificazione e una password, forniti dall'amministratore del server Web. Le pagine create possono essere ospitate in una sottocartella (directory) di un sito già esistente, oppure possono diventare un nuovo sito. In questo caso il sito Internet viene identificato attraverso un indirizzo simbolico del tipo www.pippo.it. Un documento in formato Web può essere aperto quindi con un browser, attraverso un collegamento a Internet oppure caricandolo dal disco del proprio computer senza connettersi alla rete. Sullo schermo viene visualizzata una pagina in formato grafico: la visualizzazione è il risultato di un'elaborazione del browser che interpreta i codici contenuti nel file e li trasforma in comandi per la costruzione della pagina.

Le pagine di Internet, in particolare tutti i documenti scritti per la tecnologia Web, sono redatti con un linguaggio studiato per la gestione degli ipertesti: non si tratta di un linguaggio di programmazione, ma piuttosto di un linguaggio di formazione della pagina.

Un ipertesto è un insieme di documenti che ha la possibilità di essere consultato in modo non sequenziale, passando da un documento all'altro attraverso collegamenti (link).

Esso può contenere elementi non solo testuali ma anche immagini, suoni, filmati, e qualunque tipo di oggetto trattabile da un sistema informatico. In ambiente Internet si può accedere da un documento ad un altro documento registrato su un computer ubicato in qualsiasi parte del mondo, realizzando così un'attività che viene comunemente definita navigazione nella rete (netsurfing).

Il linguaggio HTML (HyperText Markup Language, cioè linguaggio che utilizza dei contrassegni per la formazione degli ipertesti) consente di sfruttare i vantaggi e le prestazioni derivanti dall'organizzazione ipertestuale e dall'uso degli oggetti multimediali: questo linguaggio è diventato lo standard nell'architettura WWW per creare e riconoscere i documenti ipermediali.

I documenti WWW, tipicamente scritti in HTML, sono dei normali testi di caratteri, e di conseguenza sono visibili e modificabili con qualunque programma di trattamento dei testi. I testi scritti in HTML si distinguono dai normali file di testo tramite l'estensione .html o .htm.
Tali documenti non sono altro che dei normali file di caratteri ASCII; in più vengono aggiunti i codici di formazione della pagina che prendono il nome di tag consistenti in sequenze di caratteri proprie del linguaggio HTML, che non fanno parte del testo normale, e che consentono di realizzare gli elementi caratteristici dell'ipertesto: i link e gli oggetti grafici e multimediali. Altri codici servono per semplificare l'impaginazione dei documenti, così da rendere il linguaggio utile anche per creare documenti complessi.

Per rappresentare all'interno dei documenti i link ad oggetti multimediali e i link alle pagine della rete, il linguaggio HTML utilizza i nomi di riferimenti denominati URL (Uniform Resource Locator), con i quali è praticamente possibile rappresentare ogni file o servizio in Internet.

I tag del linguaggio HTML sono costituiti da stringhe di caratteri comprese tra i simboli < e > :

< CODICE parametro1 parametro2 ... parametron>

In HTML un codice è nella maggio parte dei casi abbinato a un altro codice corrispondente, che segna la fine dell'azione prevista da quel codice. Ad esempio:

</CODICE>

Un testo in HTML viene suddiviso in almeno due sezioni:

La codifica di queste due sezioni avviene attraverso le coppie di tag < HEAD > < /HEAD > per l'intestazione e < BODY > < /BODY > per il corpo. Inoltre un documento HTML è di norma delimitato dai due tag < HTML > < /HTML > .

Struttura di una pagina HTML

back