[successivo] [precedente] [inizio] [fine] [indice generale] [violazione GPL] [translators] [docinfo] [indice analitico] [volume] [parte]


Capitolo 171.   Trasferimento e sincronizzazione di dati attraverso la rete

A fianco del problema della realizzazione di una riproduzione speculare di informazioni pubblicate sulla rete, c'è anche quello di gestire un sistema di copia remota tra elaboratori, per dati che non sono messi a disposizione del pubblico, soprattutto allo scopo di mantenerli allineati.

Per questo tipo di problema, non avrebbe senso utilizzare il protocollo FTP, come sarebbe necessario per un sito speculare standard. Piuttosto, si fa uso di script o programmi che si basano sui servizi di una shell per l'accesso remoto, come rsh o ssh (capitoli 140 e 202).

171.1   Rdist

Rdist (1) è un sistema di copia che permette di mantenere l'allineamento di uno o più elaboratori (host), mantenendo le informazioni relative alla proprietà, ai permessi e alla data di modifica dei file coinvolti.

L'aggiornamento dei dati si basa sul confronto delle date di modifica e delle dimensioni dei file. In linea di principio, non conta il fatto che i dati siano più recenti o meno, basta che siano diversi. Naturalmente, è possibile istruire Rdist in modo che aggiorni solo i file più recenti, così come si possono definire altri dettagli.

L'operazione di allineamento delle copie parte dall'elaboratore che contiene i dati originali, contattando i vari nodi presso cui si trovano le copie da allineare. In questo senso va inteso il nome di Rdist: Remote distribution, ovvero, distribuzione remota.

171.1.1   Principio di funzionamento

Rdist si avvale di due eseguibili per stabilire il collegamento necessario al trasferimento dei dati da allineare: rdist dalla parte dell'elaboratore utilizzato come punto di partenza per la distribuzione dei file (l'origine) e rdistd dalla parte degli elaboratori contenenti le copie da allineare (le destinazioni).

Tuttavia questo non basta. È necessario anche l'uso di rsh; inoltre l'accesso remoto relativo deve essere configurato in modo che l'utente, generalmente root, possa accedere agli elaboratori da allineare senza l'inserimento di alcuna parola d'ordine.

In pratica, si utilizza rdist per ordinare l'allineamento dei dati; questo utilizza rsh per connettersi con uno degli elaboratori remoti coinvolti, allo scopo di avviare lì il programma rdistd. Quindi, attraverso la connessione tra rdist e rdistd, ottenuta per mezzo di rsh, avviene la verifica delle corrispondenze e il trasferimento dei dati necessari.

Dalla descrizione fatta, dovrebbe essere chiaro che Rdist non è un servizio di rete, nel senso che non esiste un demone in ascolto su una certa porta TCP/IP. Rdist si avvale del servizio reso da rsh, che da solo (probabilmente anche con rcp) non basterebbe a risolvere il problema dell'allineamento delle copie remote.

171.1.2   Origine e destinazione

Generalmente, quando si indicano i dati da allineare, si fa riferimento a un'origine, rappresentata da un percorso del file system locale, e a una destinazione composta semplicemente dal nome del nodo. In questa situazione, si intende che il percorso indicato come origine sia lo stesso nel file system del nodo di destinazione.

Per esempio, se si vuole allineare la directory /tmp/prove/ciao/ del file system locale, con il nodo remoto linux.brot.dg, senza specificare una directory remota, si intende che debba trattarsi della stessa anche in quel file system.

Se invece si specifica anche la directory remota, la destinazione diventa esplicita, così che questa può essere anche una posizione diversa da quella del nodo di origine.

171.1.3   Modalità di distribuzione

Prima ancora di vedere come si utilizza e si configura Rdist, è utile analizzare alcune delle modalità di funzionamento. La loro conoscenza permette di comprendere le possibilità di Rdist e il senso di ciò che si fa.

Come si vedrà meglio più avanti, la modalità di funzionamento viene definita attraverso una o più parole chiave, fornite per mezzo dell'opzione -o. Segue l'elenco di alcune di queste parole chiave.

Modalità Descrizione
verify Non effettua alcun allineamento di dati, si verifica solo che i dati siano allineati. Se non lo sono, si ottiene l'elenco di ciò che andrebbe aggiornato.
whole Se si specifica una directory remota, la modalità whole fa sì che nella directory di destinazione venga riprodotto tutto il percorso originale.
Per esempio, utilizzando la modalità whole, se si vuole allineare la directory /tmp/prove/ciao/ del file system locale, con il nodo remoto linux.brot.dg nella directory /tmp/, si otterrà la directory /tmp/tmp/prove/ciao/.
younger Fa in modo che vengano aggiornati solo i dati che nell'origine risultano avere una data di modifica più recente.
compare Fa in modo che vengano aggiornati solo i file che differiscono nel contenuto. Per determinarlo, i file vengono comparati in modo binario; se risultano diversi, avviene la modifica nelle copie da allineare.
ignlnks Fa in modo che venga ignorato il problema dei collegamenti simbolici che non sono risolti. In pratica, con questa modalità i collegamenti vengono riprodotti tali e quali, anche se puntano a qualcosa che non c'è.
chknfs Ignora la verifica e l'allineamento dei dati che nel nodo di destinazione risultano collocati in un file system di rete (NFS).
chkreadonly Ignora la verifica e l'allineamento dei dati che nel nodo di destinazione risultano collocati in un file system montato in sola lettura.
chksym Fa in modo di tollerare i collegamenti simbolici nella destinazione. In pratica, se nella destinazione i file o le directory sono spostati rispetto all'origine, ma per mantenere uniformità appaiono dei collegamenti, questi non vengono rimossi e si accetta la variazione locale.
quiet Riduce la quantità di messaggi. Per la precisione non segnala i file che vengono aggiornati.
remove Elimina i file estranei. Se viene aggiornata una directory intera, i file che si trovano già nella destinazione, ma non sono presenti nell'origine, vengono rimossi.
nochkowner Non verifica l'utente proprietario per i file che esistono già nella destinazione. La proprietà dell'utente viene modificata solo se il file richiede un aggiornamento per altri motivi.
nochkgroup Non verifica il gruppo proprietario per i file che esistono già nella destinazione. La proprietà del gruppo viene modificata solo se il file richiede un aggiornamento per altri motivi.
nochkmode Non verifica i permessi per i file che esistono già nella destinazione. I permessi vengono modificati solo se il file richiede un aggiornamento per altri motivi.
nodescend Fa in modo che le directory vengano trattate come file normali, senza allineare anche il loro contenuto e le sottodirectory eventuali.
numchkowner L'allineamento delle copie è fatto in modo che i file nella destinazione abbiano lo stesso numero UID di quelli dell'origine. Quando non si utilizza questa modalità, Rdist fa in modo che i file abbiano lo stesso nominativo-utente, utilizzando il numero UID necessario in base alla configurazione del nodo di destinazione.
numchkgroup L'allineamento delle copie è fatto in modo che i file nella destinazione abbiano lo stesso numero GID di quelli dell'origine. Quando non si utilizza questa modalità, Rdist fa in modo che i file abbiano lo stesso nominativo di gruppo, utilizzando il numero GID necessario in base alla configurazione del nodo di destinazione.
savetargets Nel caso in cui dei file nella destinazione debbano essere sostituiti, questi vengono salvati con l'estensione .OLD. Se esistono già copie di sicurezza del genere, queste vengono sovrascritte senza essere rinominate ulteriormente.

171.1.4   Configurazione

Le operazioni da compiere con Rdist possono essere inserite in un file di configurazione. Se attraverso le opzioni non si fa riferimento a qualcosa di diverso, o comunque non si vuole ignorare questo file, il nome predefinito è distfile, oppure, in sua mancanza, Distfile, collocato nella directory corrente.

La struttura di questo file di configurazione è un po' strana. Come accade spesso, il simbolo # introduce un commento che termina alla fine della riga; inoltre, le righe vuote sono ignorate.

All'interno del file è possibile dichiarare delle variabili, attraverso le quali, il resto delle direttive può diventare più semplice da leggere. La loro dichiarazione avviene in direttive che utilizzano la sintassi seguente:

nome_variabile = valore

La loro espansione avviene con la notazione seguente, dove le parentesi graffe (che in questo caso vanno intese letteralmente) sono necessarie per fare in modo che il nome della variabile venga preso in considerazione per intero (diversamente si utilizzerebbe solo il primo carattere).

${nome_variabile}

Nelle direttive che definiscono l'allineamento tra origine e destinazione, si fa spesso riferimento a elenchi di nomi. Questi possono essere indicati raggruppandoli attraverso l'uso di parentesi tonde, come mostrato nella sintassi seguente:

nome | ( [nome [nome]...] )

Come si vede, quando l'elenco è formato da un nome soltanto, non occorrono parentesi, anche se queste si possono usare comunque. L'elenco tra parentesi è spaziato semplicemente, senza bisogno di altri simboli di separazione; inoltre è possibile indicare l'elenco nullo.

Questi raggruppamenti possono essere assegnati a delle variabili che successivamente possono essere usate per rappresentarli. In questo senso, si possono eseguire delle operazioni elementari che si richiamano vagamente alla teoria degli insiemi.

elenco + elenco

elenco - elenco

elenco & elenco

La prima espressione restituisce un elenco che contiene tutti gli elementi dei due elenchi; in pratica, rappresenta l'unione dei due. La seconda restituisce un elenco contenente gli elementi presenti nel primo insieme, che non si trovano nel secondo. La terza restituisce l'intersezione dei due insiemi, cioè un elenco di elementi presenti in entrambi i raggruppamenti.

Gli elenchi di file possono essere definiti attraverso caratteri jolly, ma solo quando questi sono riferiti all'elaboratore locale (quello di origine). Sono ammissibili i caratteri jolly della shell C (csh); in pratica sono validi: l'asterisco (*), il punto interrogativo (?), le parentesi quadre e le parentesi graffe, con lo stesso significato che hanno anche con la shell Bash.

Il tipo di direttiva più importante è quello che definisce l'allineamento di un gruppo di file o directory nell'origine con un gruppo di nodi di destinazione. Anche se la sintassi seguente mostra una struttura scomposta su più righe, in realtà tutto potrebbe apparire su una riga sola, a discapito della leggibilità.

[etichetta:]
        origine -> destinazione
                [comando;]...

L'etichetta è un nome facoltativo, terminato da due punti (:), a cui si può fare riferimento per selezionare un gruppo ristretto di azioni; l'origine è un elenco di file e directory; la destinazione è un elenco di nodi rappresentati per nome o attraverso l'indirizzo IP, con l'eventuale aggiunta di un prefisso costituito dal nominativo-utente da utilizzare per l'accesso remoto; infine, i comandi sono delle indicazioni aggiuntive che definiscono in particolare l'operazione da compiere e permettono di stabilire delle modalità dell'allineamento dei dati.

La destinazione può essere composta da un elenco di nomi che rispettano la sintassi seguente. L'utente, rappresenta il nome utilizzato per l'accesso attraverso rsh.

[utente@]host

I comandi possono essere di tipo differente e così utilizzano sintassi differenti. Segue la descrizione di questi comandi.

Comando Descrizione

install [-oelenco_modalità] [destinazione]

Copia dei file e delle directory che, in base alle modalità specificate (o predefinite), richiedono aggiornamento. Le modalità possono essere indicate come appare nella sintassi: precedute da -o, proseguendo con un elenco dei nomi di modalità che si vogliono attivare. Questo elenco è staccato semplicemente utilizzando la virgola, senza spazi aggiuntivi.
Se viene indicato un percorso finale, si intende specificare esplicitamente una destinazione nel file system dell'elaboratore a cui sono diretti i dati. Generalmente si tratta di una directory, a meno che l'origine sia composta semplicemente da un solo file.

except elenco_da_escludere

Esclude un gruppo di file e directory dalle operazioni che altrimenti avrebbero luogo in base agli altri comandi. In pratica permette di escludere la «installazione» di alcuni file e directory riferiti all'elaboratore di origine.
È ammesso l'uso di caratteri jolly.

except_pat elenco_modelli_regexp_da_escludere

Esclude un gruppo di file e directory dalle operazioni che altrimenti avrebbero luogo in base agli altri comandi, indicandoli attraverso espressioni regolari.

special [elenco] "comando_sh"

Permette di eseguire un comando nell'elaboratore remoto, dopo l'aggiornamento di ogni file indicato nell'elenco. In pratica, il comando viene eseguito solo se il file è stato aggiornato. Se non viene indicato alcun file nell'elenco, il comando viene eseguito per ogni file aggiornato.
Il comando viene eseguito nell'elaboratore remoto utilizzando la shell sh e può anche essere composto da più comandi, separati con il punto e virgola. Questo comando eredita alcune variabili di ambiente: FILE, contenente il percorso assoluto, nell'origine, del file che è stato aggiornato; REMFILE, contenente il percorso assoluto, nella destinazione, del file che è stato aggiornato; BASEFILE, contenente il nome, senza percorso, del file che è stato aggiornato; si riferisce al nome nell'origine.

cmdspecial elenco "comando_sh"

Permette di eseguire un comando nell'elaboratore remoto, dopo l'aggiornamento di tutti i file. L'elenco fornito come primo argomento viene trasmesso attraverso la variabile di ambiente FILES, nella quale, i vari elementi appaiono separati da due punti (:).

notify elenco_email

Invia un messaggio contenente le operazioni compiute attraverso la posta elettronica. L'indirizzo può essere espresso con un nome, senza l'indicazione del nodo; in tal caso si riferisce a quello di destinazione.

Di seguito vengono mostrati e descritti alcuni esempi riferiti alla configurazione di Rdist attraverso il file distfile oppure Distfile.


GRUPPO_HOST = ( roggen.brot.dg root@linux.brot.dg )

Dichiara la variabile GRUPPO_HOST a cui viene attribuito l'elenco di nodi composto da roggen.brot.dg e da linux.brot.dg specificando anche il nominativo-utente root, da utilizzare per accedere presso questo ultimo nodo.


GRUPPO_ORIGINE = ( /usr /opt )

Dichiara la variabile GRUPPO_ORIGINE a cui viene attribuito l'elenco di file e directory da duplicare nella destinazione remota. Vengono specificate le directory /usr/ e /opt/.


GRUPPO_ESCLUSO = ( /usr/src/linux* /opt/marameo )

Dichiara la variabile GRUPPO_ESCLUSO a cui viene attribuito l'elenco di file e directory da escludere dalla duplicare nella destinazione remota. Vengono specificati tutti i file e le directory che corrispondono al modello /usr/src/linux* e la directory (o il file) /opt/marameo.


${GRUPPO_ORIGINE} -> ${GRUPPO_HOST}
        install -oremove,ignlnks ;
        except ${GRUPPO_ESCLUSO} ;
        except /usr/share/games ;
        special /opt/pippo/etc/configura "/opt/pippo/bin/rigenera" ;

Dichiara l'allineamento tra un gruppo di file e directory dell'elaboratore di origine, espresso dalla variabile GRUPPO_ORIGINE, con un gruppo di nodi di destinazione, espresso dalla variabile GRUPPO_HOST, utilizzando gli stessi percorsi nelle varie destinazioni, attivando le modalità remove e ignlnks. In particolare vengono esclusi dall'allineamento i file e le directory rappresentati dalla variabile GRUPPO_ESCLUSO e anche quanto contenuto nella directory /usr/share/games/ (si presume che sia una directory, ma questo non è indicato esplicitamente). Infine, quando viene aggiornato il file /opt/pippo/etc/configura, viene avviato il programma /opt/pippo/bin/rigenera nella destinazione (probabilmente serve a ricostruire altri file in funzione del contenuto del file modificato).


kernel:
/usr/src/linux* -> root@linux.brot.dg
        install /usr/local/src ;
        notify ( tizio daniele@dinkel.brot.dg ) ;

Dichiara l'allineamento tra i file e le directory che corrispondono al modello /usr/src/linux* con il nodo linux.brot.dg (utente root), nella directory /usr/local/src/. Al termine dell'allineamento, viene inviato un messaggio a tizio@linux.brot.dg e a daniele@dinkel.brot.dg.

171.1.5   Avvio del programma

rdist [opzioni] [etichetta...]

rdist [opzioni] -c origine... [utente_remoto@]host_destinazione[:directory_destinazione]

L'eseguibile rdist è quello attraverso il quale si ottiene l'allineamento tra un elaboratore di origine e uno o più elaboratori di destinazione. rdist si avvale normalmente di un file di configurazione, indicato espressamente attraverso l'opzione -f, oppure rappresentato dal file ./distfile, o da ./Distfile. Se si vuole selezionare una o più etichette all'interno del file di configurazione, si possono indicare i nomi di queste alla fine della riga di comando.

In alternativa all'uso del file di configurazione, si può indicare l'operazione di allineamento nella riga di comando, con l'opzione -c. In tal caso, sarebbe come se fosse stato usato il file di configurazione seguente:

origine... ) -> [utente_remoto@]host_destinazione
        install [directory_destinazione] ;

rdist si avvale di rsh per avviare nell'elaboratore remoto il suo «collega», rdistd, nel modo seguente:

rsh -l utente_remoto rdistd -S

Opzione Descrizione

-f file_di_configurazione

Permette di definire il file di configurazione da utilizzare. Se al posto del nome viene indicato un trattino (-), questo viene atteso dallo standard input.

-D

Abilita l'emissione di messaggi diagnostici estremamente dettagliati.

-m host

Questa opzione può apparire più volte nella riga di comando e serve a specificare uno o più elaboratori da allineare, in modo da limitarne il numero, rispetto a quanto previsto nel file di configurazione.

-n

Simula l'allineamento, limitandosi a visualizzare ciò che farebbe (potrebbe non essere attendibile).

-oelenco_modalità

Permette di indicare una o più modalità di funzionamento. Le parole chiave delle modalità devono iniziare subito dopo la lettera «o» dell'opzione, senza spazi, e l'elenco di queste è separato esclusivamente con la virgola, senza inserire altri spazi.

-p percorso_di_rdistd_remoto

Permette di indicare il percorso assoluto di rdistd da avviare nell'elaboratore remoto. Ciò può essere necessario se l'utente utilizzato per accedere attraverso rsh non ha rdistd in uno dei percorsi di avvio dei comandi (la variabile PATH).

-P percorso_di_rsh_locale

Permette di indicare il percorso assoluto necessario ad avviare rsh nell'elaboratore locale. Ciò potrebbe servire anche per avviare un programma alternativo a rsh, purché accetti le stesse opzioni fondamentali e si comporti nello stesso modo (si può provare con ssh, ma non è detto che funzioni).

Segue la descrizione di alcuni esempi.

171.2   Rsync

Rsync (2) è un sistema di copia tra elaboratori (o anche all'interno del file system dello stesso sistema locale), in grado di individuare e trasferire il minimo indispensabile di dati, allo scopo di allineare la destinazione con l'origine. L'uso di questo programma è molto semplice ed è simile a quello di rcp (Remote shell copy) o anche di scp (Secure shell copy).

L'aggiornamento dei dati, in funzione delle opzioni utilizzate, può basarsi sul confronto delle date di modifica, delle dimensioni dei file e anche sul calcolo di un codice di controllo (checksum). In linea di principio, a meno di utilizzare opzioni che specificano qualcosa di diverso, non conta il fatto che i dati siano più recenti o meno, basta che questi siano diversi per ottenerne il trasferimento.

171.2.1   Tipi di utilizzo

Rsync può utilizzare diverse modalità di trasferimento dei file, a seconda delle circostanze e delle preferenze. Per la precisione si distinguono tre possibilità fondamentali.

171.2.2   Origine, destinazione e percorsi

La forma utilizzata per esprimere l'origine e la destinazione permette di distinguere anche la modalità con cui si vuole che la copia (l'allineamento) sia eseguita.

L'indicazione dei percorsi merita attenzione. Per prima cosa si può dire che valgono regole simili a quelle della copia normale; per cui, si può copiare un file singolo, anche indicando espressamente il nome che si vuole nella destinazione (che potrebbe essere diverso da quello di origine); inoltre si possono copiare uno o più file e directory in una destinazione che sia una directory.

È diverso copiare il contenuto di una directory dal copiare una directory intera (assieme al suo contenuto); nel primo caso, si rischia di perdere la copia dei file «nascosti», ovvero quelli che iniziano con un punto.

171.2.3   Proprietà dei file

Come si vedrà in seguito, quando si utilizzano le opzioni -o (owner) e -g (group), si intende fare in modo che nella destinazione sia mantenuta la stessa proprietà dei file (dell'utente o del gruppo) che questi hanno nell'origine.

Per ottenere questo risultato, si confrontano generalmente i nomi degli utenti e dei gruppi, assegnando i numeri UID e GID necessari. Quando questa corrispondenza dovesse mancare, viene utilizzato semplicemente lo stesso numero ID. In alternativa, con l'uso dell'opzione --numeric-ids, si può richiedere espressamente l'uguaglianza numerica di UID o GID, indipendentemente dai nomi utilizzati effettivamente.

171.2.4   Avvio del programma

rsync [opzioni] origine destinazione

rsync è l'eseguibile che svolge tutte le funzioni necessarie ad allineare una destinazione, in base al contenuto di un'origine. Per questo si avvale normalmente di rsh, o di un'altra shell per l'accesso remoto.

L'origine e la destinazione possono essere riferite indifferentemente al nodo locale o a un nodo remoto. Quello che conta è che almeno una delle due sia riferita al nodo locale.

Opzione Descrizione

-v

--verbose

Permette di ottenere informazioni sullo svolgimento delle operazioni. Questa opzione può essere usata più volte, incrementando il livello di dettaglio di tali notizie.

-I

--ignore-times

Normalmente, si considera che i file che hanno la stessa dimensione e la stessa data di modifica, siano identici. Con questa opzione, si fa in modo che tale presunzione non sia valida.

-c

--checksum

Fa in modo che venga utilizzato un codice di controllo più grande del solito, precisamente di tipo MD4 da 128 bit. Naturalmente, questo implica un tempo di elaborazione più lungo, anche se garantisce una sicurezza maggiore nella determinazione delle differenze esistenti tra l'origine e la destinazione.

-a

--archive

Questa opzione rappresenta in pratica l'equivalente di -rlptDog, allo scopo di duplicare fedelmente tutte le caratteristiche originali, discendendo ricorsivamente le directory di origine.

-r

--recursive

Richiede la copia ricorsiva delle directory, cioè di tutte le sottodirectory.

-R

--relative

Fa in modo di replicare nella destinazione, aggiungendolo a questa, il percorso indicato nell'origine, che comunque deve essere relativo.

-b

--backup

Fa in modo di salvare temporaneamente i file che verrebbero sovrascritti da un aggiornamento. Questi vengono rinominati, aggiungendo un'estensione che generalmente è rappresentata dalla tilde (~). Questa estensione può essere modificata attraverso l'opzione --suffix.

-u

--update

Con questa opzione, si evita l'aggiornamento di file che nella destinazione risultano avere una data di modifica più recente di quella dei file di origine corrispondenti.

-l

--links

Fa in modo che i collegamenti simbolici vengano ricreati fedelmente, come nell'origine.

-L

--copy-links

Fa in modo che i collegamenti simbolici nell'origine, si traducano nella destinazione nei file a cui questi puntano.

-H

--hard-links

Richiede la riproduzione fedele dei collegamenti fisici. Perché ciò possa avvenire, occorre che questi collegamenti si riferiscano allo stesso gruppo di file di origine che viene indicato nella riga di comando.

-W

--whole-file

Rsync utilizza normalmente un metodo che gli permette di trasferire solo il necessario per aggiornare ogni file. Con questa opzione, si richiede espressamente che ogni file da aggiornare sia inviato per intero. Questo può essere utile quando si allineano dati contenuti nella stessa macchina e qualunque elaborazione aggiuntiva servirebbe solo a rallentare l'operazione.

-p

--perms

Riproduce fedelmente i permessi.

-o

--owner

>Quando Rsync viene utilizzato con i privilegi dell'utente root, permette di assegnare a ciò che viene copiato lo stesso utente proprietario che risulta nell'origine.

-g

--group

>Quando Rsync viene utilizzato con i privilegi dell'utente root, permette di assegnare a ciò che viene copiato lo stesso gruppo proprietario che risulta nell'origine.

-D

--devices

>Quando Rsync viene utilizzato con i privilegi dell'utente root, permette di copiare file di dispositivo.

-t

--times

Fa in modo che venga riprodotta fedelmente la data di modifica dei file.

-n

--dry-run

Si limita a simulare l'operazione, senza eseguire alcuna copia. È utile per verificare l'effetto di un comando prima di eseguirlo veramente.

-x

--one-file-system

Permette di non superare il file system di partenza, nell'origine.

--delete

Fa sì che vengano cancellati i file nella destinazione che non si trovano nell'origine. Come si può intuire, si tratta di un'opzione molto delicata, in quanto un piccolo errore nell'indicazione dei percorsi si può tradurre nella perdita involontaria di dati.
È questa la situazione più indicata per utilizzare l'opzione -n in modo da verificare in anticipo l'effetto del comando.
Per motivi di sicurezza, la cancellazione dei file che non trovano riscontro nell'origine, ha luogo solo per le directory indicate espressamente nell'origine; eventualmente si può imporre la cancellazione di questi con l'opzione --force.
Se Rsync non riesce a leggere i file nell'origine, o non riesce a leggere il contenuto delle directory, si ottiene la cancellazione di quelli contenuti nella destinazione. Anche in questo senso l'opzione --delete va usata con molta prudenza.

--delete-after

Fa in modo che la cancellazione dei file che non sono più nell'origine, avvenga alla fine delle altre operazioni; diversamente, ciò avviene all'inizio.

--force

Con questa opzione si consente la cancellazione di directory che non sono vuote quando si utilizza anche l'opzione --delete, oppure quando nell'origine quel nome corrisponde a un file normale.

-e

 --rsh comando

Permette di specificare il comando (il programma) da utilizzare come shell per l'accesso remoto. Normalmente viene usata rsh, ma in alternativa si potrebbe utilizzare ssh, o altro se disponibile.
L'uso di una shell alternativa per l'accesso remoto, può essere configurato utilizzando la variabile di ambiente RSYNC_RSH.

--rsync-path percorso

Permette di specificare il percorso assoluto necessario ad avviare rsync nell'elaboratore remoto. Ciò è utile quando il programma non è nel percorso degli eseguibili nell'utenza remota.

--exclude modello

Permette di indicare un nome di file (o directory), o un modello contenente caratteri jolly, riferito a nomi da escludere dalla copia. Il nome o il modello indicato, non deve contenere riferimenti a percorsi; inoltre è bene che sia protetto in modo che non venga espanso dalla shell usata per avviare il comando.
È il caso di sottolineare che, se viene escluso il nome di una directory si impedisce un eventuale attraversamento ricorsivo del suo contenuto.

--exclude-from file

Si comporta come l'opzione --exclude, con la differenza che il suo argomento è il nome di un file locale contenente un elenco di esclusioni.

-C --cvs-exclude

Questa opzione permette di escludere una serie di file, usati tipicamente da CVS, RCS e anche in altre situazioni, che generalmente non conviene trasferire. Si tratta dei nomi e dei modelli seguenti: RCS, SCCS, CVS, CVS.adm, RCSLOG, cvslog.*, tags, TAGS, .make.state, .nse_depinfo, *~, .#*, ,*, *.old, *.bak, *.BAK, *.orig, *.rej, .del-*, *.a, *.o, *.obj, *.so, *.Z, *.elc, *.ln, core.
Inoltre, vengono esclusi anche i file elencati all'interno di ~/.cvsignore, della variabile di ambiente CVSIGNORE e all'interno di ogni file .cvsignore, ma in questo ultimo caso, solo in riferimento al contenuto della directory in cui si trovano.

--suffix suffisso

Permette di definire il suffisso da usare per le copie di sicurezza dei file che vengono sovrascritti.

-z

--compress

Prima di trasmettere i dati, li comprime. Ciò permette di risparmiare risorse di rete durante il trasferimento dei dati.

--numeric-ids

Fa in modo di mantenere gli stessi numeri ID, quando le altre opzioni richiedono la riproduzione della proprietà dell'utente (-o) o del gruppo (-g).

Segue la descrizione di alcuni esempi.

171.2.5   Variabile RSYNC_PASSWORD

L'uso della variabile di ambiente RSYNC_PASSWORD può essere molto utile per automatizzare le operazioni di sincronizzazione dati attraverso Rsync. Quando viene usato come cliente e il nodo remoto richiede un'autenticazione attraverso una parola d'ordine, questa può essere fornita attraverso la variabile RSYNC_PASSWORD. Se la variabile non c'è, Rsync richiede all'utente di inserirla.

Quello che si vede sotto, potrebbe essere uno script personale di un utente che deve aggiornare frequentemente il modulo prove nel nodo roggen.brot.dg (identificandosi come tizio). Quando il servente remoto richiede la parola d'ordine, il cliente locale rsync la legge direttamente dalla variabile RSYNC_PASSWORD.


#!/bin/sh
RSYNC_PASSWORD=1234ciao
export RSYNC_PASSWORD
rsync -rlptD -zv /tmp/prove/ tizio@roggen.brot.dg::prove

171.2.6   Servente Rsync

Se si vuole utilizzare Rsync per trasferire dati tra elaboratori differenti, senza usare una shell remota, occorre attivare nell'elaboratore remoto un servente Rsync. Si tratta in pratica dello stesso programma rsync, ma avviato con l'opzione --daemon.

Il servente Rsync può essere avviato in modo indipendente, in ascolto da solo sulla porta TCP 873, oppure sotto il controllo del supervisore dei servizi di rete. In questa modalità di funzionamento è necessario predisporre un file di configurazione: /etc/rsyncd.conf.

Nel caso si voglia avviare il servente Rsync in modo autonomo dal supervisore dei servizi di rete, basta un comando come quello seguente:

rsync --daemon

Se si vuole inserire Rsync nel controllo del supervisore dei servizi di rete (cosa di sicuro consigliabile), occorre intervenire nel file /etc/services per definire il nome del servizio,


rsync           873/tcp

inoltre occorre agire nel file /etc/inetd.conf (nel caso specifico di Inetd) per annunciarlo al supervisore dei servizi di rete:


rsync   stream  tcp     nowait  root    /usr/bin/rsync  rsyncd --daemon

Rsync utilizzato come servente si avvale del file di configurazione /etc/rsyncd.conf per definire una o più directory che si vogliono rendere accessibili attraverso il protocollo di Rsync, come una sorta di servizio FTP. Come nel caso dell'FTP, è possibile offrire l'accesso a chiunque, in modo anonimo, oppure si può distinguere tra utenti definiti all'interno della gestione di Rsync. Questi utenti sono potenzialmente estranei all'amministrazione del sistema operativo in cui Rsync si trova a funzionare, per cui occorre aggiungere un file di utenti e parole d'ordine specifico.

Rsync definisce moduli le aree che mette a disposizione (in lettura o anche in scrittura a seconda della configurazione). Quando si vuole accedere a un modulo di Rsync si utilizza la notazione seguente:

[utente_rsync@]host::modulo[/percorso_successivo]

Quando si accede a un modulo, il servente Rsync esegue un chroot() nella directory a cui questo fa riferimento, più o meno come accade con l'FTP anonimo. Per fare un esempio concreto, se il modulo prova fa riferimento alla directory /home/dati/ciao/ nel nodo dinkel.brot.dg, l'indirizzo dinkel.brot.dg::prova/uno/mio fa riferimento al percorso /home/dati/ciao/uno/mio in quell'elaboratore.

171.2.7   Configurazione di Rsync come servente

Il file di configurazione di Rsync, /etc/rsyncd.conf, serve solo nel caso lo si voglia utilizzare come servente. Se si intende fare affidamento sul servizio di rsh o di ssh, non c'è alcun bisogno di preoccuparsene.

Il contenuto del file di configurazione è organizzato in moduli, ognuno dei quali descrive le impostazioni riferite a una directory del file system sottostante.

Ogni riga descrive un tipo di informazione. Le righe vuote, quelle bianche e ciò che è preceduto dal simbolo # viene ignorato. È ammessa la continuazione nella riga successiva utilizzando la barra obliqua inversa (\) alla fine della riga.

I moduli vengono identificati da un nome racchiuso tra parentesi quadre e la loro indicazione occupa tutta una riga; le informazioni riferite a un modulo sono costituite da tutte le direttive che appaiono nelle righe seguenti, fino all'indicazione di un altro modulo. Le direttive che descrivono i moduli sono delle opzioni che definiscono dei parametri e sono in pratica degli assegnamenti di valori a questi parametri. Alcuni tipi di parametri possono essere collocati prima di qualunque dichiarazione di modulo e si tratta in questo caso di opzioni globali che riguardano tutti i moduli (alcuni parametri possono apparire solo all'inizio e non all'interno della dichiarazione dei moduli).

Le opzioni globali sono quelle direttive (o parametri) che si collocano prima della dichiarazione dei moduli. Alcuni parametri possono essere collocati solo in questa posizione, mentre gli altri, le opzioni dei moduli, pur essendo stati preparati per la descrizione dei singoli moduli, possono essere usati all'inizio per definire un'impostazione generale. L'elenco seguente mostra solo l'uso di alcuni parametri delle opzioni globali.

Opzione Descrizione

motd file = file

Se presente, indica un file all'interno del quale viene prelevato il testo da mostrare agli utenti quando si connettono (il «messaggio del giorno»).

max connections = n_massimo_connessioni_simultanee

Come avviene nel protocollo FTP, anche con Rsync può essere importante porre un limite alle connessioni simultanee. Se non viene specificata questa opzione, oppure se si usa il valore zero, non si intende porre alcuna restrizione.

Segue l'elenco di alcune opzioni dei moduli.

Opzione Descrizione

comment = stringa_di_descrizione_del_modulo

Questa opzione permette di fornire una descrizione che può essere letta dagli utenti che accedono. Il suo scopo è chiarire il contenuto o il senso di un modulo il cui nome potrebbe non essere sufficiente per questo. Non è necessario racchiudere tra apici doppi il testo della stringa.

path = percorso_della_directory

Questo parametro è obbligatorio per ogni modulo. Serve a definire la directory, nel file system dell'elaboratore presso cui è in funzione il servente Rsync, a cui il modulo fa riferimento. Quando si accede al modulo, Rsync esegue la funzione chroot(), in modo che la directory corrispondente appaia come la radice del modulo stesso.

read only = true|false

read only = yes|no

Questa opzione permette di definire se il modulo debba essere accessibile solo in lettura oppure anche in scrittura. Se l'opzione non viene specificata, si intende che l'accesso debba essere consentito in sola lettura. Assegnando il valore booleano false (oppure no) si ottiene di consentire anche la scrittura.

uid = nome_utente|id_utente

gid = nome_gruppo|id_gruppo

Queste due opzioni permettono di definire l'utente e il gruppo per conto dei quali verranno svolte le operazioni all'interno del modulo. In pratica, Rsync utilizzerà quella identità per leggere o scrivere all'interno del modulo; questo può essere un mezzo attraverso il quale controllare gli accessi all'interno della directory corrispondente.

auth users = utente_rsync[utente_rsync]...

Questa opzione permette di indicare un elenco di nomi di utenti di Rsync a cui è consentito di accedere al modulo. Senza questa opzione, si concede l'accesso a chiunque, mentre in tal modo si impone il riconoscimento in base a un file di utenti definito attraverso il parametro secrets file.

secrets file = file_di_utenti_e_parole_d'ordine

Questa opzione è obbligatoria se viene usato il parametro auth users. Serve a indicare il file all'interno del quale Rsync può trovare l'elenco degli utenti e delle parole d'ordine (in chiaro).

Segue la descrizione di alcuni esempi.


uid = nobody
gid = nobody
[ftp]
        path = /home/ftp
        comment = Esportazione dell'area FTP attraverso Rsync           

Questo esempio, preso da rsyncd.conf(5), rappresenta una configurazione minima allo scopo di definire il modulo ftp che consenta l'accesso in sola lettura alla directory /home/ftp per qualunque utente. In pratica, si vuole permettere l'accesso all'area FTP anche attraverso Rsync. Si osservi in particolare l'uso dei parametri uid e gid, all'inizio del file, in modo che Rsync utilizzi i privilegi dell'utente e del gruppo nobody per la lettura dei file.


[ftp]
        path = /home/ftp
        comment = Esportazione dell'area FTP attraverso Rsync           
        uid = nobody
        gid = nobody

Si tratta di una variante dell'esempio precedente, in cui i parametri uid e gid sono stati collocati all'interno del modulo. In questo caso, dal momento che non ci sono altri moduli, l'effetto è lo stesso.


[pippo]
        comment = Applicativo PIPPO
        path = /opt/pippo
        read only = false
        uid = tizio
        gid = tizio
        auth users = caio, semproni
        secrets file = /etc/rsyncd.secrets

L'esempio mostra la descrizione del modulo pippo all'interno di un file di configurazione che potrebbe contenerne anche altri. In pratica, gli utenti che Rsync identifica come caio e semproni, possono scrivere all'interno della directory /opt/pippo/, generando eventualmente anche delle sottodirectory, utilizzando i privilegi dell'utente e del gruppo tizio (secondo quanto definito dal sistema operativo di quell'elaboratore). Il file delle parole d'ordine necessario a identificare gli utenti caio e semproni è /etc/rsyncd.secrets.

171.2.8   File degli utenti e delle parole d'ordine secondo Rsync

Quando si utilizza Rsync come servente e si richiede una forma di autenticazione agli utenti che accedono, è necessario predisporre un file di testo contenente dei record secondo la sintassi seguente:

nome_utente:parola_d'ordine_in_chiaro

Dal momento che il file viene letto da Rsync con i privilegi dell'utente root, è sufficiente che questo file abbia il permesso di lettura per l'amministratore del sistema.

Rsync non stabilisce quale sia la collocazione e il nome di questo file; è il parametro secrets file del file di configurazione a definirlo volta per volta. In generale, nella documentazione originale si fa l'esempio del file /etc/rsyncd.secrets. L'esempio seguente mostra il caso degli utenti caio e semproni, a cui sono state abbinate rispettivamente le parole d'ordine tazza e ciao.


caio:tazza
semproni:ciao

È bene ribadire che questo file non ha alcun nesso con il file /etc/passwd (né con /etc/shadow). Gli utenti di Rsync possono non essere stati registrati (nel modo consueto) nell'elaboratore presso cui accedono.

Appunti di informatica libera 2003.01.01 --- Copyright © 2000-2003 Daniele Giacomini -- daniele @ swlibero.org

1) Rdist   software non libero: non è consentita la riproduzione fisica della documentazione e la vendita di assistenza; inoltre la modifica non è consentita esplicitamente

2) Rsync   GNU GPL


Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome trasferimento_e_sincronizzazione_di_dati_attraverso_la_rete.html

[successivo] [precedente] [inizio] [fine] [indice generale] [violazione GPL] [translators] [docinfo] [indice analitico]