You are on page 1of 34

Protecció del

copyright
electrònic
Josep Domingo Ferrer
Francesc Sebé Feixas
PID_00160567
© FUOC • PID_00160567 Protecció del copyright electrònic

Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada,
reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com
químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització
prèvia per escrit dels titulars del copyright.
© FUOC • PID_00160567 Protecció del copyright electrònic

Índex

Introducció.................................................................................................. 5

Objectius....................................................................................................... 6

1. Protecció del copyright en continguts multimèdia................... 7


1.1. Importància de protegir el copyright ......................................... 7
1.2. Impediment de còpia enfront de detecció de còpia ................... 8

2. Estat de la tècnica de detecció de còpia...................................... 10


2.1. Encast i recuperació de la marca ................................................ 10
2.2. Propietats dels sistemes de marca d'aigua i d'empremta
digital ........................................................................................... 11
2.3. Classificació dels sistemes de marca d'aigua ............................... 14
2.4. Classificació dels sistemes d'empremta digital ............................ 15

3. Marca d'aigua per a imatges estàtiques....................................... 17


3.1. Imatges digitals ........................................................................... 17
3.2. Robustesa dels sistemes de marca d'aigua per a imatges ............. 17
3.3. Procediment general de marcatge d'una imatge ......................... 18
3.4. Estudi del cas 1: descripció d'un sistema semicec de marca
d'aigua per a imatges .................................................................. 18
3.4.1. Algorisme d'encast de marca ......................................... 19
3.4.2. Algorisme de recuperació de marca ............................... 21

4. Marca d'aigua per a vídeo digital................................................. 24


4.1. Vídeo digital ................................................................................ 24
4.2. Robustesa dels sistemes de marca d'aigua per a vídeo digital ..... 25
4.3. Estudi del cas 2: descripció d'un sistema cec de marca d'aigua
per a imatges aplicable a vídeo digital ....................................... 25
4.3.1. Algorisme d'encast de marca ......................................... 26
4.3.2. Algorisme de recuperació de marca ............................... 28

Resum............................................................................................................ 30

Activitats...................................................................................................... 31

Exercicis d'autoavaluació........................................................................ 31

Solucionari.................................................................................................. 32

Glossari......................................................................................................... 33
© FUOC • PID_00160567 Protecció del copyright electrònic

Bibliografia................................................................................................. 34
© FUOC • PID_00160567 5 Protecció del copyright electrònic

Introducció

En aquest mòdul didàctic donarem els fonaments per a entendre les tècniques
de protecció de la propietat intel·lectual de la informació multimèdia objecte
de transacció electrònica.

Comencem distingint les dues estratègies bàsiques de protecció anticòpia: im-


pediment de la còpia i detecció de la còpia. Tot seguit, ens centrem en les
tècniques de detecció, que són les més prometedores.

Dintre de la detecció de còpia, parlarem de les marques�d'aigua, que són l'eina


fonamental d'aquesta estratègia. També parlarem d'un cas particular de marca
d'aigua, les anomenades empremtes�digitals.

Descriurem de manera genèrica els processos d'encast i de recuperació de la


marca. Tot seguit, enumerarem quins requisits ha de complir un bon siste-
ma de marcatge anticòpia i classificarem els sistemes de marca d'aigua i els
d'empremta digital.

Finalment, estudiarem dos sistemes amb propietats diferents, un d'aquests


apropiat per al marcatge d'imatges estàtiques i l'altre, per al marcatge de vídeo
digital.
© FUOC • PID_00160567 6 Protecció del copyright electrònic

Objectius

Els materials didàctics d'aquest mòdul us han de permetre d'assolir els objec-
tius següents:

1. Fer-vos càrrec de la importància de protegir el copyright de la informació


multimèdia.

2. Entendre per què la detecció de la còpia ofereix més garanties que


l'impediment de la còpia.

3. Conèixer els principis operatius de les marques d'aigua i de les empremtes


digitals.

4. Tenir clara una classificació de les tècniques existents de detecció de còpia.

5. Comprendre el disseny i el funcionament de dos sistemes de marca d'aigua


amb propietats diferents.
© FUOC • PID_00160567 7 Protecció del copyright electrònic

1. Protecció del copyright en continguts multimèdia

"First, there's the room you can see through the glass -that's
just the same as our drawing room, only the things go the other way."
L. Carroll (1872). Through the Looking Glass And What Alice Found There (cap. 1).

1.1. Importància de protegir el copyright

Una de les característiques de la informació en format digital és que la seva


qualitat no es degrada al llarg del seu cicle de vida. La informació en format
analògic no es comporta igual: tots hem vist que la qualitat d'una cinta d'àudio
o de vídeo analògic disminueix si es reprodueix moltes vegades o si la cinta
no és l'original.

Quan s'associa un valor econòmic a una certa informació digital (per exemple,
una cançó MP3, una pel·lícula MPEG, etc.), la no-degradació de les còpies es-
devé per al propietari intel·lectual de la informació més un problema que un
avantatge. Aquesta situació es produeix en el comerç electrònic de continguts
multimèdia.

En efecte, si no s'adopten mesures de protecció, qualsevol comprador d'un


contingut en pot fer tantes còpies com vulgui, sense pràcticament cap cost i
sense que la qualitat de les còpies minvi respecte de l'original.

És evident que la possibilitat d'obtenir sense cost còpies idèntiques a l'original


és una amenaça per a la viabilitat econòmica del comerç electrònic de contin-
gut multimèdia.

En el cas extrem, podria arribar a passar que el propietari del contingut només
en vengués una còpia i que, a partir d'aquest moment, es fessin tot de còpies
il·legals.

Del que hem dit anteriorment, se'n desprèn l'extrema importància de prote-
gir-se contra la còpia no autoritzada d'informació en format electrònic. La pro-
tecció de la propietat intel·lectual en la societat de la informació ha estat un
dels objectius del cinquè programa marc d'R+D de la Unió Europea.
© FUOC • PID_00160567 8 Protecció del copyright electrònic

1.2. Impediment de còpia enfront de detecció de còpia

Hi ha dues estratègies bàsiques de protecció:

• Impediment de la còpia
• Detecció de la còpia

a)�Impediment�de�còpia

L'estratègia d'impediment�de�còpia consisteix a fer impossible la rea-


lització de còpies no autoritzades. Se sol basar en mecanismes de ma-
quinari.

En sistemes de distribució de continguts per mitjà d'Internet, es pretén evitar


la còpia descontrolada utilitzant la criptografia.

Sistema de control de distribució


Lectura complementària
Dintre del sistema hi ha un programari anomenat Digital Rights Management (DRM) que
entra en funcionament quan un contingut (un vídeo o una cançó) ha de ser venut. Aquest Per aprofundir en el progra-
programari xifra un determinat producte i l'envia a un servidor, per mitjà del qual els mari Digital Rights Manage-
clients el poden adquirir. Quan un client compra un contingut, en fa el pagament i aquest ment vegeu l'article de S. M.
se li envia juntament amb la clau necessària per a desxifrar-lo. El sistema es basa en el Cherry (2001). "Making Mu-
sic Pay", a IEEE Spectrum (oc-
fet que el programari de reproducció és l'únic capaç de desxifrar el contingut i que no
tubre 2001).
permet que el producte desxifrat sigui copiat a disc.

En última instància, per a impedir la còpia, cal que els dispositius reproductors
i gravadors de contingut multimèdia incorporin unes certes mesures anticòpia
en el seu maquinari.

En un entorn real, en què les especificacions d'aquests dispositius són obertes


o almenys conegudes per un gran nombre de fabricants, és bastant il·lusori
pensar que tots els dispositius fabricats compliran estrictament les mesures
previstes.

El trencament de les mesures anticòpia dels discos compactes (CD), de les tele-
visions xifrades de pagament i, darrerament, dels discos de vídeo digital (DVD)
són exemples del fracàs clamorós de l'estratègia d'impediment de còpia.
© FUOC • PID_00160567 9 Protecció del copyright electrònic

El cas del DVD

Al sistema DVD, els continguts del vídeo hi incorporen uns bits d'informació anticòpia.
Un reproductor DVD que s'ajusti a les especificacions no copiarà dades que portin uns
bits anticòpia amb el significat ‘no copien'.

Si els bits anticòpia duen el significat ‘copiar una vegada', aleshores el reproductor per-
metrà de copiar les dades una vegada, però, a partir de la còpia, no se'n podrà fer d'altres
(la còpia portarà uns bits anticòpia dient ‘no copien').

Per tal d'evitar el canvi no autoritzat dels bits anticòpia per part de tercers, el sistema DVD
preveu el xifratge dels continguts mitjançant un criptosistema (molt feble) anomenat
Content Scrambling System (CSS). Doncs bé, resulta que, el 1999, uns intrusos (hackers)
alemanys i noruecs van posar a Internet el programa DeCSS, que permet de desxifrar i
llegir continguts DVD, amb la qual cosa és fàcil alterar-ne els bits anticòpia i saltar-se el
mecanisme d'impediment de còpia.

b)�Detecció�de�còpia

L'estratègia de detecció�de�còpia no pretén evitar que un determinat


contingut sigui copiat, sinó que es basa a fer que les còpies il·legals si-
guin identificables.

La detecció de la còpia un cop aquesta s'ha produït és l'única estratègia que


queda si fracassa l'intent d'impedir que les còpies no autoritzades es facin.
L'objectiu és encastar una marca�d'aigua, consistent en una seqüència de bits
d'informació, dintre dels continguts que cal protegir.

Si la marca d'aigua conté informació sobre el propietari, la seva extracció


permetrà de demostrar a qui pertany el contingut en cas de conflicte. Si
la marca d'aigua conté informació sobre el comprador al qual s'ha venut
la còpia, llavors s'anomena empremta�digital.

Les empremtes digitals són un subtipus de marca d'aigua que permeten de


seguir el rastre de les còpies il·legals que es fan circular; si tot va bé, permeten
de saber qui ha estat el comprador que les ha redistribuïdes de manera no
autoritzada.
© FUOC • PID_00160567 10 Protecció del copyright electrònic

2. Estat de la tècnica de detecció de còpia

El funcionament dels sistemes de detecció de la còpia basats en marques


d'aigua és el següent:

1) Per a encastar un bit de la marca, cal un fragment dels continguts que cal
protegir, del qual hi hagi dues versions lleugerament diferents. En aquest con-
text, la diferència entre versions es considera lleugera si és imperceptible per a
l'usuari del contingut. Si es fa servir la primera versió, es codifica un "0" com a
valor del bit de marca corresponent; si es fa servir la segona versió, es codifica
un "1".

2) Quan es ven una còpia del contingut, el venedor tria un valor per a cada
bit de la marca i fa servir les versions pertinents dels fragments corresponents
als bits per a construir un contingut marcat.

3) Quan el venedor troba un contingut redistribuït, en recupera la marca per


tal de demostrar que en posseeix el copyright o bé per a trobar quin comprador
és responsable de la redistribució.

2.1. Encast i recuperació de la marca

El procediment per a encastar una marca d'aigua en un contingut està repre-


sentat a la figura 1 i té, com a paràmetres d'entrada, la marca M, els continguts
que cal protegir X i una clau secreta K emprada per a escampar M dintre de X.
La sortida del procediment d'encast és l'objecte marcat .

Figura 1: Procediment d'encast de


marca

El procediment per a recuperar una marca a partir d'un objecte marcat redis-
tribuït està representat a la figura 2 i té, com a paràmetres d'entrada, l'objecte
redistribuït ', la clau secreta K emprada durant l'encast i, segons les propie-
tats de l'esquema de marca d'aigua utilitzat, algun paràmetre addicional.

Depenent del sistema, la sortida del procediment és la marca recuperada M' o


bé una variable booleana SÍ/NO.
© FUOC • PID_00160567 11 Protecció del copyright electrònic

Figura 2. Procediment de recuperació de marca

Noteu que és possible que l'objecte marcat redistribuït ', pres com a entrada
per al procediment de recuperació, no correspongui exactament a cap objecte
marcat ' segons el procediment d'encast. En efecte, entre el moment de mar-
car-lo i el moment en què se'n detecta la redistribució, el contingut pot haver
sofert algunes manipulacions. Per tant, és possible (tot i que no és desitjable)
que la marca recuperada M' no correspongui a la marca realment encastada M.

2.2. Propietats dels sistemes de marca d'aigua i d'empremta


digital

"Il faut qu'il n'exige pas le secret, et qu'il puisse sans inconvénient tomber entre les mains
de l'ennemi."

A. Kerckhoff (1883, gener). "La cryptographie militaire". Journal des Sciences Militaires (9,
pàg. 5-38).

Fins ara hem dit que cal encastar la marca d'aigua en els continguts que cal
protegir. En aquest apartat incidirem en el fet que cal fer-ho bé.

Llistem, a continuació, algunes propietats desitjables en els sistemes de marca


d'aigua:

• Imperceptibilitat: l'encast de la marca no ha de deteriorar perceptible- PSNR


ment la qualitat dels continguts que es volen protegir. Altrament, la pro-
Són les inicials de Peak-Sig-
tecció del copyright seria una victòria pírrica. La imperceptibilitat es pot nal-to-Noise Ratio i es mesura
mesurar de manera subjectiva, recorrent a l'opinió de persones que exami- en decibels (dB). Com més al-
ta és la PSNR entre dos contin-
nin el contingut marcat, o bé de manera objectiva, amb mesures com la guts, més semblants són.

màxima relació senyal-soroll (PSNR) entre el contingut original i el con-


tingut marcat.

• Robustesa: es diu que un sistema de marca d'aigua és robust contra un cert Atac
atac de manipulació si, després d'atacar el contingut marcat amb aquesta
Una atac és qualsevol alteració
manipulació, encara se'n pot recuperar la marca que s'hi va encastar abans realitzada a un objecte mar-
de l'atac. cat amb l'objectiu de fer que
la marca deixi de ser recupera-
ble.

La robustesa�ideal consisteix en el fet que l'alteració necessària que cal


aplicar per a eliminar la marca hagi de ser tan gran que faci que el con-
tingut perdi el seu valor comercial.

Podem distingir dues menes d'atacs:


© FUOC • PID_00160567 12 Protecció del copyright electrònic

• Atacs d'un sol usuari


• Atacs de confabulació

Els atacs d'un sol usuari són realitzats per un sol comprador de manera acci- Atacs de confabulació
dental o intencionada.
Els atacs de confabulació no-
més tenen sentit en els siste-
Exemple d'atac d'un sol usuari mes d'empremta digital (en
què les marques encastades
Si els continguts són imatges, els atacs poden consistir en compressió amb pèrdua, dis- són diferents per a cada cò-
torsió geomètrica (rotació, escalat, estirament, etc.), filtratge passabaix... De fet, per al pia). Els tractarem més enda-
vant.
cas de les imatges, hi ha un programa benchmark de domini públic, anomenat StirMark,
que efectua una bateria d'atacs estàndard per a provar la robustesa dels sistemes de marca
d'aigua (vegeu les activitats al final del mòdul).

• Marcatge�múltiple: es refereix a la possibilitat d'encastar diverses marques Soroll


superposades en el mateix contingut, de manera que més tard es puguin
Alteracions aleatòries aplicades
recuperar una per una sense que s'hagin interferit. Per a cada marca encas- sobre un contingut.
tada, les marques que s'hi encasten posteriorment poden ser vistes com a
soroll, per la qual cosa un sistema de marcatge múltiple ha de ser neces-
sàriament robust al soroll.

• Capacitat: fa referència al nombre màxim de bits de marca que podem


encastar al sistema amb un cert volum de contingut sense modificar la
propietat d'imperceptibilitat.

• Mínim�secret: els procediments d'encast i de recuperació de la marca hau- Principi de Kerckhoff


rien de ser públics, de manera que només la clau emprada quedés en se-
El criptògraf holandès A.
cret, segons l'anomenat principi de Kerckhoff. Malauradament, moltes de les Kerckhoff (1835-1903) fou el
solucions comercials de marca d'aigua es basen en algorismes no publicats, primer de defensar que la se-
guretat d'un mètode de xifrat-
amb la qual cosa no és possible saber quina protecció oferirien aquestes ge ha de residir totalment en
el secret de la clau (no en el de
solucions si se'n filtressin els algorismes. Clarament, el secret de la clau l'algorisme). Vegeu la cita de
Kercknoff al principi del suba-
depèn de l'usuari del sistema, mentre que el secret de l'algorisme depèn del partat.
seu dissenyador, amb la qual cosa una indiscreció del dissenyador com-
prometria la seguretat dels usuaris.
(1)
En anglès, tamper-proof.

Cal posar èmfasi en el fet que la propietat de robustesa esmentada anterior-


ment fa referència a atacs genèrics independents del sistema de marca d'aigua
utilitzat. Si l'atacant coneix els algorismes d'encast i de recuperació del sistema,
i fa servir aquest coneixement per a muntar atacs específics, aleshores es parla
de resistència�a�manipulacions�intencionades1 una propietat força més di-
fícil d'aconseguir que la robustesa.

Si el sistema de marca d'aigua es fa servir per a encastar empremtes digitals (la


marca d'aigua és diferent per a cada còpia i n'identifica el comprador), alesho-
res podem enunciar tres propietats addicionals:

• Seguretat�per�al�comprador: no hauria de passar que la recuperació de la


marca porti a acusar de redistribució compradors innocents.
© FUOC • PID_00160567 13 Protecció del copyright electrònic

• Resistència� a� confabulacions: no hauria de passar que la confabulació


d'uns quants compradors els permeti de fabricar una nova còpia a partir
de la qual no es pugui recuperar la marca de cap d'ells.

Noteu que, en el cas de les empremtes digitals, la marca d'aigua encastada és diferent per
a cada còpia venuda, amb la qual cosa és concebible que uns compradors confabulats
aconsegueixin localitzar i/o alterar alguns bits de la marca encastada a força de comparar
i/o barrejar les seves còpies respectives. La confabulació triomfa si la marca recuperada
de la còpia barrejada no correspon a cap dels confabulats.

• Anonimat: la compra de continguts marcats amb empremtes digitals no


hauria de fer perdre l'anonimat al comprador.

El requisit d'anonimat només té sentit en un context de transacció electrònica


anònima, en què el pagament pels continguts adquirits també sigui anònim.
De tota manera, hem de dir que, actualment, no hi ha cap sistema efectiu
d'empremta digital que satisfaci aquest requisit.

Els dissenyadors de sistemes d'empremta digital solen fer el que s'anomena


suposició�de�marcatge.

En la suposició�de�marcatge, se suposa que dos o més compradors des-


honestos només poden localitzar i esborrar bits de marca a partir de la
comparació de les seves còpies.

En altres paraules, la suposició anterior vol dir que els dissenyadors de siste-
mes d'empremta digital es concentren a trobar codificacions de les marques
encastades que els permetin de superar atacs de confabulació. Quant a la res-
ta d'atacs, suposen que el sistema de marca d'aigua amb el qual s'encasten i
recuperen les marques és prou robust per a superar-los.

Així, doncs, un sistema d'empremta digital consisteix en el següent:

• Un sistema de marca d'aigua robust i que no requereixi subministrar la


marca que cal recuperar com a paràmetre d'entrada de l'algorisme de re-
cuperació. Aquest requisit és lògic, perquè cada còpia marcada porta una
marca diferent, amb la qual cosa no se sap a priori quina marca es vol re-
cuperar.

• Una codificació de les marques que cal encastar que els permeti de sobre-
viure als atacs de confabulació previstos en la suposició de marcatge.
© FUOC • PID_00160567 14 Protecció del copyright electrònic

2.3. Classificació dels sistemes de marca d'aigua

Per a classificar els sistemes de marca d'aigua existents, ens fixarem en els pa-
ràmetres d'entrada que requereix el seu algorisme de recuperació de marca.
Òbviament, aquest algorisme sempre requereix com a entrades el contingut
marcat redistribuït i també la clau secreta usada durant l'encast (vegeu la figu-
ra 1). Són els paràmetres d'entrada addicionals els que ens permeten de fer la
classificació següent:

• Sistemes�cecs: són aquells que poden recuperar la marca amb només els
dos paràmetres d'entrada esmentats anteriorment, el contingut marcat
redistribuït ' i la clau secreta K. Es tracta dels sistemes més flexibles, per
bé que no els més robustos.

• Sistemes�semicecs: per a poder recuperar la marca, aquesta mena de sis-


temes requereixen, a més de ' i K, o bé el contingut original X o bé la
marca M que s'està cercant. Això presenta inconvenients respecte dels sis-
temes cecs:
– Si es requereix X, l'inconvenient és que el recuperador de marca ha de
tenir accés al contingut original, amb la qual cosa ha de coincidir amb
el propietari del contingut (o bé tenir-ne la confiança absoluta).

– Si es requereix M, aleshores el sistema no és utilitzable per a empremta


digital (en què no se sap a priori quina marca es recuperarà).

• Sistemes�privats: aquests sistemes necessiten tota la informació possible


per a recuperar la marca. Això vol dir ', X, K i M. La sortida que dóna
l'algorisme de recuperació de marca és una variable booleana SÍ/NO que
val "SÍ", si s'ha trobat M dins de ', i val "NO", si no s'hi ha trobat M.

Figura 3: Classificació dels sistemes de marca d'aigua


segons la informació necessària per a la recuperació.
© FUOC • PID_00160567 15 Protecció del copyright electrònic

2.4. Classificació dels sistemes d'empremta digital

(2)
El concepte d'empremta digital2 fou proposat per N.R. Wagner el 1983. Al fi- En anglès, fingerprinting.

nal dels anys noranta, van aparèixer nous sistemes d'empremta digital, amb
la qual cosa el concepte de Wagner fou "rebatejat" com a empremta digital si-
mètrica. Actualment, podem distingir els tipus de sistemes d'empremta digital
següents (alguns d'aquests tipus no són mútuament excloents):

• Sistemes�simètrics: en aquests sistemes, el venedor marca la còpia i des-


prés la ven. Per tant, tant el comprador com el venedor tenen accés a la
còpia marcada. Com que el venedor veu la còpia marcada després de mar-
car-la, un venedor deshonest pot redistribuir la còpia corresponent a un
usuari i després acusar-lo en fals. D'altra banda, en un judici un comprador
culpable podria esgrimir l'argument anterior per a acusar en fals el vene-
dor de la redistribució. Per tant, els sistemes simètrics d'empremta digital
no proporcionen cap prova de redistribució davant de tercers: el venedor
només es pot convèncer ell mateix que un comprador és culpable.

• Sistemes�asimètrics: foren proposats per Pfitzmann i Schunter el 1996 per Problemes pràctics
tal d'obtenir una prova de redistribució. L'algorisme d'encast de marca ja
Les propostes de sistemes asi-
no l'executa el venedor tot sol, sinó que és un protocol en el qual coope- mètrics de Pfitzmann i altres es
ren venedor i comprador. El protocol és tal que el venedor no veu la cò- basen en el càlcul segur a múl-
tiples bandes, una tècnica que,
pia marcada resultant, però, quan la troba redistribuïda (per Internet, per tot i ser possible en teoria, és
molt difícil d'implementar en
exemple), pot recuperar-ne la marca encastada i, per tant, la identitat del la pràctica. El 1999, Domin-
go-Ferrer proposà fer servir
comprador. Com que el comprador és l'únic que coneix la còpia marcada, l'eina criptogràfica de la trans-
llevat que la redistribueixi, el coneixement de la còpia marcada per part ferència inconscient, proposta
que té una complexitat quan-
del venedor és una prova acusatòria contra el comprador. tificable, però que continua es-
sent massa elevada.

• Sistemes�anònims: foren proposats el 1997 per Pfitzmann i Waidner per a


intentar satisfer el requisit d'anonimat. Tots els sistemes anònims propo-
sats són també asimètrics, amb la particularitat que el comprador utilitza
pseudònims en el protocol de marcatge per a preservar el seu anonimat.

• Sistemes�anticonfabulació: foren introduïts per Boneh i Shaw el 1995 i


el seu objectiu és satisfer el requisit de resistència a les confabulacions. Es
basen en una codificació de les marques encastades tal que si una confa-
bulació de fins a c compradors (on c és un paràmetre) fabrica una marca a
partir de les seves marques diferents, la marca resultant serà descodificada
com la marca d'un dels confabulats. D'aquesta manera, la confabulació no
queda impune. Boneh i Shaw construïren uns codis especials per a codifi-
car les marques i, en el 2000, Domingo i Herrera van demostrar que és pos-
sible resistir confabulacions de dos compradors amb alguns codis, correc-
tors d'errors dels habitualment utilitzats per a la transmissió d'informació
en canals amb soroll.
© FUOC • PID_00160567 16 Protecció del copyright electrònic

Cal dir que, actualment, no hi ha implementacions ni de sistemes asimètrics


ni de sistemes anònims. El problema fonamental és aconseguir un protocol
d'encast de marca eficient.
© FUOC • PID_00160567 17 Protecció del copyright electrònic

3. Marca d'aigua per a imatges estàtiques

3.1. Imatges digitals

Etimologia de píxel
Des d'un punt de vista de processament informàtic, una imatge�digital
consisteix en una matriu de dues dimensions en què cada element conté El mot anglès pixel prové de
l'acrònim transformat dels
informació sobre un punt de color. Aquests punts són els anomenats mots picture element.
píxels. Els nombres de files i columnes d'aquesta matriu corresponen a
l'amplada i l'alçada de la imatge, respectivament.

La informació continguda en un píxel dependrà del tipus d'imatge. Així,


doncs, en el cas d'una imatge monocroma, cada píxel contindrà un nombre
enter que representarà el seu nivell de gris. Si el que tenim és una imatge en
color, són tres enters, cadascun dels quals indica el nivell de cada pla de color
(roig, verd i blau).

A causa de l'elevada quantitat d'informació continguda en una imatge, els fit- La mida de les imatges
xers necessaris per al seu emmagatzematge tenen una mida massa gran perquè
Una imatge corresponent a
siguin còmodes de manipular i transportar. És per això que habitualment les una fotografia en color de
imatges s'emmagatzemen en formats de fitxer que apliquen una compressió. 1.024 files i 1.024 columnes
en què cada nivell de color es
representa amb un enter d'1
byte ocupa un total de 1.024
Hi ha dos tipus de compressió: × 1.024 × 3 = = 3.145.728 by-
tes. Aquesta mida ja és prou
gran per a no poder emmagat-
• Sense pèrdua: compressió en què la informació recuperada després de des- zemar-la en un disquet de 3,5
polzades.
comprimir és exactament la mateixa que abans de comprimir.

• Amb pèrdua: compressió en què la informació recuperada després de des-


comprimir pot ser lleugerament diferent a l'original. Amb aquest tipus de
compressió, s'aconsegueixen fitxers comprimits de mida més petita que
són els utilitzats més habitualment.

El fet que les imatges s'emmagatzemin en formats de compressió amb pèrdua


fa que les tècniques de marca d'aigua utilitzades hagin de ser prou robustes
perquè la marca inserida segueixi essent recuperable després de la compressió.

3.2. Robustesa dels sistemes de marca d'aigua per a imatges

Ja s'ha esmentat que la robustesa d'un sistema de marca d'aigua preveu la re-
sistència de la marca contra les manipulacions no intencionades que pot ex-
perimentar l'objecte durant el seu cicle de vida.
© FUOC • PID_00160567 18 Protecció del copyright electrònic

En el cas d'una imatge, aquestes manipulacions acostumen a ser:

• Compressió amb pèrdua


• Canvi de format
• Filtratge
• Escalat
• Variació de la relació d'aspecte
• Retallada dels marges

També n'hi ha d'altres de menys habituals com ara petites rotacions.

Convé, doncs, que els sistemes de marca d'aigua siguin robustos contra aquests
tipus de manipulació.

3.3. Procediment general de marcatge d'una imatge

Tal com s'ha dit amb anterioritat, l'encast d'una marca d'aigua dintre de contin-
guts multimèdia es fa realitzant petits canvis al producte. En el cas de les imat-
ges, aquestes modificacions afecten el nivell de color dels píxels de la imatge.

Habitualment, el procés�de�marcatge d'una imatge es divideix en les


fases següents:

1. Determinar els píxels de la imatge en què s'encastaran els bits de la


marca.

2. Determinar la màxima modificació aplicable a cada píxel per tal que


el marcatge sigui imperceptible.

3. Encastar la marca.

El procés de recuperació de la marca�encastada en una imatge passa


per les fases següents:

1. Determinar els píxels on està encastat cada bit.

2. Recuperar els diferents bits de la marca.

3. Comprovar que la marca recuperada és correcta.

3.4. Estudi del cas 1: descripció d'un sistema semicec de marca


d'aigua per a imatges

A continuació descriurem un sistema de marca d'aigua semicec per a imatges.


© FUOC • PID_00160567 19 Protecció del copyright electrònic

En la descripció d'aquest sistema, denotarem la imatge com el conjunt de tots


els seus píxels X = {xi : 1 ≤ i ≤ n}, en què n és el nombre de píxels de la imatge
i xi és el nivell de color de l'i-èsim píxel. Suposarem que la imatge és mono-
croma, per tant, cada píxel solament conté un enter d'informació de nivell de
gris. L'extensió del sistema per a imatges en color és ben senzilla, solament cal
aplicar la tècnica a cadascun dels plans de color per separat.

3.4.1. Algorisme d'encast de marca

En aquest sistema, l'entitat que vol encastar una marca d'aigua ha de propor-
cionar el valor dels paràmetres següents:

• q: correspon a un nivell de qualitat de l'algorisme de compressió amb pèr- JPEG


dua JPEG. S'utilitza per a determinar a quins píxels s'encastaran els bits
Sigles de Joint Photographic Ex-
de la marca i quina és la modificació que cal aplicar a cadascun per a fer perts Group. És un format de
aquest encast. compressió amb pèrdua per
imatges. La quantitat de pèr-
dua es controla mitjançant el
nivell de qualitat que pot valer
• p: correspon a un nivell de PSNR. S'utilitza per a afitar la màxima diferència entre 1 i 100.
entre la imatge abans i després del procés de marcatge.

• k: llavor d'un generador pseudoaleatori criptogràficament segur. La seva


funció és generar una seqüència pseudoaleatòria amb la qual xifrar els bits
abans d'encastar-los.

• La marca que cal encastar. Consisteix en una seqüència binària que deno-
tarem m.

1)� Determinació� dels� píxels� de� la� imatge� en� què� s'encastaran� bits� de� la
marca.

En aquest pas, s'agafa la imatge original i es comprimeix utilitzant l'algorisme


JPEG amb paràmetre q. A continuació, es descomprimeix el fitxer comprimit
i en resulta l'obtenció de la imatge X'.

Cal que tinguem en compte que la imatge X' serà lleugerament diferent a X,
a causa que l'algorisme JPEG aplica compressió amb pèrdua.

Aleshores, per cada píxel i de la imatge calculem δi : = xi – x'i. Aquells píxels en


què δi ≠ 0 serà on s'encastaran els bits de la marca. Observem que els píxels amb
δi ≠ 0 són aquells en què ha variat el nivell de color després de la compressió
amb pèrdua.

2)�Determinació�de�la�modificació�aplicable�a�cada�píxel
© FUOC • PID_00160567 20 Protecció del copyright electrònic

En aquesta fase, s'utilitzen els valors calculats a la fase anterior. A cada píxel

xi amb δi ≠ 0, se li podrà variar el nivell de color un màxim de unitats.

Cal tenir en compte que δ pot ser negatiu.

Aquesta manera d'aconseguir la imperceptibilitat es basa en el fet que fixem el


màxim increment realitzable a un píxel com aquell causat per la compressió
amb pèrdua JPEG amb factor de qualitat q. D'aquesta manera, l'impacte visual
del marcatge serà semblant al causat per JPEG.

3)�Encast�de�la�marca

Primerament, es fa un procés de codificació i replicació de la seqüència m per


tal que es pugui recuperar íntegrament, malgrat que alguns dels bits encastats
canviïn de valor a causa de les alteracions en la imatge marcada. Aquest es fa
de la manera següent:

a) Es codifica m utilitzant un codi corrector d'errors. La seqüència codificada Codi corrector d'errors
resultant, l'anomenarem M.
Codi que permet, mitjançant
la redundància, la correcció
b) Es replica la seqüència codificada M tants cops com sigui necessari fins a per part del receptor d'un mis-
satge amb possibles errors que
obtenir una seqüència de longitud igual al nombre de píxels de la imatge amb aquest hagi pogut tenir.

δi ≠ 0. La seqüència resultant, l'anomenarem M'.

A continuació, xifrem en flux la seqüència M'. Això es fa de la manera següent:

c) Mitjançant un generador pseudoaleatori amb la clau k com a llavor, generem


una seqüència de bits S de la mateixa longitud que M'.

d) Xifrem M' en flux amb la seqüència S. El resultat d'aquesta operació, el


denotarem com S' : = M' ⊕ S.

Un cop es té la marca codificada, replicada i xifrada, es procedeix a encastar-la


dintre de la imatge X. La imatge marcada, la denotarem com:

={ i, 1 ≤ i ≤ n}.

Això es fa de la manera següent:

e) Inicialitzar j: = 0. Per a i =1 fins n fer:

• Si δi = 0 aleshores i : = xi

• Si δi ≠ 0 aleshores
– Calcular j: = j + 1
© FUOC • PID_00160567 21 Protecció del copyright electrònic

– Si S'j = 0 aleshores i: = xi – δi

– Si S'j = 1 aleshores i: = xi + δi

Observem que a les posicions en què δi no hi ha modificació, ja que el píxel


de la imatge marcada és igual al de la imatge original. A la resta, l'encast del
bit corresponent es fa incrementant o disminuint el nivell de color, depenent
de si té valor 1 o 0, respectivament.

Finalment, es fa un darrer pas que té per objectiu reduir la diferència entre la


imatge original i la imatge marcada fins que el PSNR entre les dues imatges
sigui superior o igual a l'indicat mitjançant el paràmetre p.

f) Mentre PSNR ( /X) < p fer

• Escollir aleatòriament un índex i tal que l ≤ i ≤ n.

• Si i – xi > 3 aleshores i: = i – 1.

• Si i – xi < –3 aleshores i: = i +1 .

El fet de reduir solament l'increment si la diferència entre el píxel marcat i el


píxel original és més gran que 3 es fa per fer que la marca no sigui massa feble.

La sortida d'aquest algorisme és la imatge marcada .

3.4.2. Algorisme de recuperació de marca

L'entitat que vol recuperar la marca d'una imatge ha de proporcionar el valor


dels paràmetres q, k (que han de ser els mateixos que es van utilitzar durant
l'algorisme d'encast). Després, també ha de conèixer la longitud de la seqüèn-
cia que es busca i cal tenir accés a la imatge original X (és un sistema semicec).
La imatge presumptament marcada de la qual volem recuperar la marca la de-
notarem com ={ i1 ≤ i ≤ n}.

1)�Determinar�els�píxels�on�està�encastat�cada�bit.

De la mateixa manera que en l'algorisme d'encast, s'agafa la imatge original X


i es comprimeix utilitzant l'algorisme JPEG amb paràmetre q. Després es torna
a descomprimir i s'obté la imatge X'.

Aleshores, per cada píxel i de la imatge es calcula δi : = xi – x'i. Aquells píxels


amb δi ≠ 0 és on hi ha els bits de la marca.
© FUOC • PID_00160567 22 Protecció del copyright electrònic

2)�Recuperar�els�diferents�bits�de�la�marca.

La marca es recupera de la manera següent:

a) A partir de la longitud de la seqüència que es busca, calcular la seva longitud


un cop codificada, és a dir, .

b) A continuació, s'inicialitzen dos vectors uns [.] i zeros [.] de mida inici-
alitzant totes les posicions a zero. La funció d'aquests dos vectors és comptar,
per cada bit de , quants cops es recupera amb valor 1 i quants cops amb
valor 0.

c) Utilitzant la clau k com a llavor, es genera la seqüència pseudoaleatòria S de


longitud igual al nombre de píxels de X amb δi ≠ 0.

d) Per cada píxel i en què δi ≠ 0, calcular i: = i–xi.

e) Sigui j: = 0.

Per a i = 1 fins n fer


Si δi ≠ 0 aleshores

I. j:= j+1. Si j> aleshores j: = 1

II. Si signe δi = signe( i) aleshores j: =1

III) Si signe ( i) = signe ( i) aleshores j: =0

IV. Calcular el j-èssim bit de com j: = j + sj

V. Si 'j = 1 aleshores uns [j] : =uns [j] + 1

VI. Si 'j = 0 aleshores zeros [j] : = zeros [j] + 1

En els passos (II) i (III) es determina quin bit conté el píxel i. Si la imatge de
la qual volem recuperar la marca no ha estat alterada, aleshores i = xi ± δi

depenent de si el bit que calia encastar era un 1 o un 0. Així, doncs, i = i –

xi = (xi ± δi) – xi = ± δi. D'aquesta manera, si el signe de ( i) és igual al signe de


(δi), es dedueix que l'increment va ser positiu, amb la qual cosa el bit encastat
és un 1; altrament és un 0.
© FUOC • PID_00160567 23 Protecció del copyright electrònic

Observeu que una alteració en un píxel li fa canviar el valor del bit encastat
solament si el signe de ( i) es veu modificat. Aquest fet fa que el mètode toleri
determinades alteracions.

Al pas (IV), utilitzant el bit corresponent de la seqüència S es desxifra el bit


recuperat anteriorment i, a continuació, al pas (V) o (VI), ens anotem el resultat
obtingut.

A continuació,

f) Per a j = 1 fins fer

• si uns [j] > zeros [j] aleshores j : = 1,


• si zeros [j] > uns [j] aleshores j :=0.

El valor definitiu de cada bit de la marca codificada es determina com aquell


que ha aparegut més cops després de recuperar-lo dels diferents píxels en què
estava encastat.

g) Finalment, descodifiquem amb el mateix codi corrector d'errors utilitzat


en l'algorisme de marcatge i obtenim la marca descodificada.

3)�Comprovar�que�la�marca�és�correcta

Per a comprovar si una marca descodificada recuperada és correcta, cal que


abans de ser encastada se li hagi afegit redundància en forma de suma de com-
provació o CRC. En aquest cas, solament cal comprovar que aquesta redun-
dància sigui correcta.
© FUOC • PID_00160567 24 Protecció del copyright electrònic

4. Marca d'aigua per a vídeo digital

4.1. Vídeo digital

El vídeo digital consisteix en una seqüència d'imatges digitals que es re-


produeixen seqüencialment en el temps i que pot tenir so o no tenir-ne.

En el cas que tinguem un vídeo amb imatge i so, aquest s'emmagatzema en un


únic fitxer que conté els dos fluxos multiplexats: el flux d'imatge i el flux de so.

Generalment, els formats de compressió de vídeo aconsegueixen taxes de com- Taxa de compressió
pressió més altes que les d'imatge ja que aprofiten la redundància temporal.
Quocient entre la mida del fit-
Tot i això, la mida d'un fitxer de vídeo comprimit amb una qualitat acceptable, xer original i la mida del fitxer
es compta per desenes de megabits, depenent de la seva durada i del format comprimit.

de compressió utilitzat.

A causa que un vídeo pot tenir so, l'encast de marca es pot realitzar tant en el
flux d'imatge com en el de so, com en tots dos.

Les modificacions per a encastar una marca en un flux d'imatge es poden fer
de dues maneres:

• Aplicant modificacions als píxels dels diferents fotogrames. Fer-ho així re-
sulta molt costós en el temps, perquè, per a marcar cada fotograma, pri-
mer cal descomprimir-lo, després encastar-hi la marca i després tornar-lo
a comprimir. D'altra banda, és una tècnica més portable, ja que no depèn
del format de compressió utilitzat.

• Aplicant modificacions als bits de la seqüència comprimida o semi-des-


comprimida. D'aquesta manera, ens estalviem les etapes de descompressió
i compressió. És una manera molt més ràpida, però que depèn del format
de compressió utilitzat.

Independentment dels fluxos en què encastem la marca (imatge i/o so) o de si Classificació dels sistemes
ho fem directament sobre els píxels dels fotogrames o sobre la seva represen-
En l'apartat "Classificació de
tació comprimida, cal que el sistema utilitzat sigui cec o semicec, en aquest se- sistemes de marca d'aigua"
gon cas només en la variant que requereix conèixer la seqüència que busquem. trobareu les definicions de sis-
tema cec o semicec.

En cap cas no és factible requerir el vídeo original per a la recuperació de la


marca, pel fet que la mida d'aquest és massa gran.
© FUOC • PID_00160567 25 Protecció del copyright electrònic

4.2. Robustesa dels sistemes de marca d'aigua per a vídeo digital

Cal que un sistema de marca d'aigua per a vídeo suporti les modificacions que
se li poden fer.

Aquestes inclouen els canvis següents:

• Canvi de format.

• Compressió.

• Eliminació de fotogrames (cosa que succeeix quan solament ens interessa


un determinat tram del vídeo i n'eliminem la resta).

• Inserció de fotogrames (per exemple, els crèdits inicials d'una pel·lícula).

4.3. Estudi del cas 2: descripció d'un sistema cec de marca


d'aigua per a imatges aplicable a vídeo digital

A continuació, descriurem un sistema cec de marca d'aigua per a imatges. Com


que és un sistema cec i s'ha comprovat que és robust contra la compressió
MPEG-1, aquest sistema és utilitzable per a marcar vídeo en aquest format.

El procediment per a marcar vídeo amb aquest sistema és el següent:

1) En cas que el vídeo també contingui àudio, es fa una separació dels dos
fluxos.

2) S'agafa el flux de vídeo i per cada fotograma:

• Se'l descomprimeix.

• Se'l marca.

• Es torna a comprimir el fotograma marcat tot afegint-lo a un flux d'imatges


marcades comprimides.

3) En cas que el vídeo original contingués àudio, es tornen a multiplexar els


dos fluxos.

El procediment per a recuperar la marca d'un vídeo és el següent:

1) En cas que el vídeo també contingui àudio, es fa una separació dels dos
fluxos.
© FUOC • PID_00160567 26 Protecció del copyright electrònic

2) S'agafa el flux de vídeo i per cada fotograma:

• Se'l descomprimeix.
• Se li aplica l'algorisme de recuperació de marca.
• En cas de trobar una marca, ho registrem.

3) A partir dels resultats obtinguts, decidim si s'ha trobat una marca i quina
és aquesta.

Tal com hem fet en la descripció del sistema anterior, denotarem la imatge com
X = {xi : 1 ≤ i ≤ n}, en què n és el nombre de píxels de la imatge i xi és el nivell
de color de l'i-èsim píxel. També suposarem que la imatge és monocroma i,
per tant, cada píxel solament conté un enter d'informació de nivell de gris.
Igual que en el cas anterior, l'extensió del sistema per imatges en color és ben
senzilla, simplement aplicant la tècnica a cadascun dels plans de color per
separat.

4.3.1. Algorisme d'encast de marca

L'entitat que vol encastar la marca ha de proporcionar una sèrie de paràmetres


que són dt, lb1 , ub1 , lb2, ub2 . Tots aquests paràmetres afecten la impercepti-
bilitat i la robustesa del sistema. Descriurem més endavant el seu significat i
la utilització que se'n fa.

A més, també cal proporcionar:

• k: llavor d'un generador pseudoaleatori criptogràficament segur. La seva


funció serà determinar les posicions en les quals encastar bits de la marca
i com cal modificar els píxels.

• La marca que cal encastar. Consisteix en una seqüència binària que deno-
tarem m.

1)�Determinació�dels�píxels�de�la�imatge�on�s'encastaran�els�bits�de�la�mar-
ca

Per a fer això, primer es codifica la marca m utilitzant un codi corrector d'errors.
La seqüència resultant, l'anomenarem M. La longitud de M, la denotarem com
a .

Utilitzant k com a llavor, situar pseudoaleatòriament rajoles Ri no enca-


valcades sobre la imatge. La mida de les rajoles també està determinada per k.
L'i-èsim bit de la marca codificada s'encastarà en els píxels de la i-èsima rajola.

2)�Determinació�de�la�modificació�aplicable�a�cada�píxel
© FUOC • PID_00160567 27 Protecció del copyright electrònic

A cada píxel de la imatge, se li associa un valor anomenat component�visual


i que denotarem com a Vi. Aquests valors es calculen basant-se en la idea que
els píxels foscos i aquells que es troben en regions no homogènies de la imatge
són als que es pot aplicar una modificació més gran amb l'impacte visual més
petit.

En aquesta fase, s'utilitzen els paràmetres lb1 , ub1 , que prenen valors enters
i que s'utilitzen per a afitar inferiorment i superiorment la variació del nivell
de color dels píxels.

També s'utilitza dt, que correspon a un llindar a partir del qual els nivells de
color inferiors a aquest es consideren foscos.

Suposant que cada nivell de color pot prendre un valor entre 0 i 255, una bona
tria és dt = 70, lb1 = 2, ub1 = 11.

La manera de calcular Vi és la següent:

a) Per a cada píxel xi de la imatge es calcula la seva no-homogeneïtat amb nhi:

= max /2, per a tots els píxels xj que són veïns de xi sobre la imatge.
nhi es pot veure com una mena de derivada discreta al píxel i. Observeu que
nhi serà més gran en aquells píxels que tenen un nivell de color més diferent
respecte als seus veïns. Això passa en regions no homogènies de la imatge.

Aleshores, s'afita el valor de nhi entre lb1 i ub1 fent la correcció següent:

• Si nhi >ub1, aleshores, nhi :=ub1


• Si nhi <lb1, aleshores,nhi :=lb1

b) Per a cada píxel xi de la imatge, es calcula la seva foscor amb di: = (dt-xi)*ub1
/dt si xi <dt i di: = 0, altrament. Un píxel es considera fosc si el seu nivell de
color és inferior a dt. El valor di està entre 0 i ub1. Observeu que di val 0 per
xi = dt i va augmentant linealment fins a ub1 a mesura que el nivell de color
del píxel xi va disminuint.

c) Finalment, es calcula la component visual del píxel xi amb Vi: = max(nhi, di).

3)�Encast�de�la�marca

En aquesta fase s'utilitzen els paràmetres lb2 i ub2. Suposant que cada nivell de
color pot prendre un valor entre 0 i 255, una bona tria és lb2 =10 i ub2 =13.

Es parteix de la marca codificada M que hem calculat en la fase 1.


© FUOC • PID_00160567 28 Protecció del copyright electrònic

a) Utilitzant k com a llavor, assignar pseudoaleatòriament a cada rajola Ri un


valor ai entre lb2 iub2.

b) Per a inserir l'i-èsim bit mi de la marca M dintre de la rajola Ri:

• Dividir el rang de nivells de color que pot prendre un píxel en subintervals


de mida ai.

• Etiquetar els subintervals consecutius alternativament com a 0 o 1.

• Per a cada píxel xj que hi ha dintre de Ri:


I) Si xj està dintre d'un subinterval etiquetat amb el valor mi, aleshores,
acostar-lo al centre de l'interval incrementant-lo o disminuint-lo com a
màxim Vj nivells de color.
II) Si xj està dintre d'un subinterval etiquetat amb el valor i, aleshores,
acostar-lo al centre de l'interval veí més pròxim incrementant-lo o dismi-
nuint-lo com a màxim Vj nivells de color.

4.3.2. Algorisme de recuperació de marca

L'entitat que vol recuperar la marca d'una imatge ha de proporcionar els pa-
ràmetres lb2, ub2 i la clau secreta k . També ha de conèixer la longitud de la
seqüència que es busca. Denotarem la imatge presumptament marcada de la
qual volem recuperar la marca com a = i, 1 ≤ i ≤ n.

1)�Determinar�els�píxels�on�està�encastat�cada�bit.34

a) A partir de la longitud de la seqüència que es busca, calcular la seva longitud


un cop codificada, és a dir .

b) Utilitzant la clau k com a llavor i utilitzant el mateix algorisme que en


l'encast de marca, situar rajoles Ri no encavalcades amb la imatge. L'i-èsim
bit de la marca codificada està encastat en els píxels de la i-èsima rajola.

2)�Recuperar�els�diferents�bits�de�la�marca.

a) Per a recuperar l'i-èsim bit i de de la rajola Ri:

• Dividir el rang de nivells de color que pot prendre un píxel en subintervals


de mida ai.

• Etiquetar els subintervals consecutius alternativament com a 0 o 1.


© FUOC • PID_00160567 29 Protecció del copyright electrònic

• Inicialitzar dos comptadors uns:=0 i zeros:=0

• Per cada píxel xj de Ri:


I. Si xj està en un subinterval etiquetat com a 1, aleshores uns : = uns +1.
II. Si xj està en un subinterval etiquetat com a 0, aleshores zeros : = zeros +1.

• Si uns > zeros aleshores, ;

• Si zeros > uns aleshores, i : = 1.

Aquest primer pas s'aplica per a cadascuna de les rajoles en què hem dividit
la imatge.

b) Finalment, descodifiquem amb el mateix codi corrector d'errors utilitzat


en l'algorisme de marcatge i obtenim la marca descodificada.

3)�Comprovar�que�la�marca�és�correcta.

Per a comprovar si una marca descodificada recuperada és correcta, cal que


abans de ser encastada se li hagi afegit la redundància en forma de suma de
comprovació o CRC. En aquest cas, solament cal comprovar que aquesta re-
dundància sigui correcta.
© FUOC • PID_00160567 30 Protecció del copyright electrònic

Resum

Hi ha dues estratègies bàsiques de protecció anticòpia: impediment de la còpia


i detecció de la còpia. L'experiència (CD, DVD, etc.) demostra que només la
segona ofereix garanties reals i, en qualsevol cas, pot ser combinada amb la
primera, si es desitja.

Les marques� d'aigua són l'eina fonamental per a la detecció de la còpia, i


consisteixen a encastar de manera imperceptible un cert missatge, anomenat
marca, en el contingut multimèdia que cal protegir. Normalment, la marca
encastada diu qui és el propietari del contingut protegit.

Les empremtes�digitals són un cas particular de marca d'aigua en què la marca


encastada és diferent per a cada còpia venuda del contingut i n'identifica el
comprador.

Les propietats que ha de tenir un bon sistema de marca d'aigua són, entre
d'altres, robustesa, capacitat, imperceptibilitat i mínim�secret.

Un sistema d'empremta digital convé que sigui, a més, resistent�a�confabu-


lacions i, almenys idealment, seria desitjable que fos asimètric (per a pro-
porcionar proves de redistribució davant de tercers) i anònim (per a pre-
servar l'anonimat del comprador). Actualment, no hi ha implementacions
d'empremta digital asimètrica ni anònima.

Hem presentat dos estudis de casos consistents en sistemes de marca d'aigua


per a la protecció d'imatges que treballen en el domini espacial. El primer
és un sistema semicec que requereix la imatge original a més de la marcada
per a poder recuperar la marca. La robustesa d'aquest sistema és molt alta. El
segon estudi de cas és un sistema cec. Pel fet de ser cec, és molt més còmode
que l'anterior a l'hora de protegir grans volums d'imatges, com seria el cas del
vídeo (el recuperador de marques no necessita ni conèixer ni emmagatzemar
el vídeo original).

Cap dels dos estudis de cas presentats no requereix que el recuperador de marca
conegui a priori quina marca vol recuperar, per la qual cosa són utilitzables per
a aplicacions d'empremta digital.
© FUOC • PID_00160567 31 Protecció del copyright electrònic

Activitats
1. Implementeu un sistema de marca d'aigua semàntica per a textos ASCII en català. Heu de
definir parelles de sinònims per a paraules habituals (per exemple, llavors i aleshores). Quan
trobeu una paraula al text que té un sinònim, per a encastar un bit 0, agafeu el primer sinònim
de la parella i, per a encastar un bit 1, agafeu el segon sinònim. La clau secreta és, en aquest
cas, la llista de parelles de sinònims que feu servir i la convenció de quina codifica un 1 i
quina un 0.

2. Descarregueu el programa benchmark StirMark de www.cl.cam.ac.uk/~fapp2/water-


marking/stirmark. Aquest programa efectua un seguit de manipulacions sobre les imatges. És
un estàndard de facto per a comprovar la robustesa dels sistemes de marca d'aigua. Normal-
ment es passen les manipulacions sobre una imatge marcada i es mira si encara és possible
extreure la marca de les imatges manipulades que dóna StirMark. Proveu de passar-lo a una
imatge, encara que no estigui marcada, per a veure la quantitat de modificacions que es po-
den fer sobre una imatge, la majoria imperceptibles a l'ull humà.

3. Visiteu la pàgina web de Digimarc (www.digimarc.com). Aquesta empresa ofereix un sistema


cec de marca d'aigua els algorismes del qual no són públicament coneguts.

Exercicis d'autoavaluació
1. Suposeu que feu servir el sistema de marca d'aigua semicec explicat en el primer estudi de
cas. Suposeu que enfosquim una imatge en blanc i negre marcada dividint el nivell de gris de
tots els píxels per dos. Seria possible que l'algorisme de recuperació recuperés correctament
la marca a partir de la imatge enfosquida?

2. Amb el sistema de marca d'aigua cec del segon estudi de cas, es recupera correctament la
marca si la imatge marcada ha sofert una petita rotació (posem per cas de 2 graus)?

3. Poseu un exemple de confabulació amb èxit de dos compradors en un sistema d'empremta


digital. Si el comprador c1 té la marca m1 enterrada al seu contingut i el comprador c2 hi té
la marca m2, es diu que hi ha èxit si aconsegueixen un contingut en què la marca encastada
és m3, tal que, després de passar-hi un codi corrector d'errors, m3 no descodifica ni com a m1
ni com a m2. Suposeu que es fa servir un codi corrector d'errors tal que corregeix exactament
un error (és a dir, si m3 es diferencia en una posició de m1, m3 es descodifica com m1; el
mateix amb m2). Suposem també que les marques mi tenen 8 bits i que s'aplica la suposició
de marcatge.
© FUOC • PID_00160567 32 Protecció del copyright electrònic

Solucionari
Exercicis�d'autoavaluació

1. La resposta és no. Amb gran probabilitat, i = i – xi (pas 4 de l'algorisme recuperació)


donarà negatiu perquè el nivell de color enfosquit xi serà més petit que l'original xi. Per tant,
el signe de les δi serà negatiu pràcticament per a tots els píxels; per tant, en tots els píxels on
el signe hauria hagut de ser positiu (aproximadament el 50%), això portarà a una recuperació
errònia dels bits encastats (pas 5 de l'algorisme de recuperació).

2. Mentre la major part dels píxels que hi havia a cada rajola abans de la rotació hi continuïn
essent després de la rotació, es podrà extreure el bit de marca correcte a partir dels píxels de
la rajola. Si la rotació és petita, la majoria de píxels continuaran a la seva rajola i la marca
serà recuperada correctament.

3. Sigui m1 = 00000111, m2 = 11110000. Aleshores c1 i c2 comparen els seus continguts i


veuen en quins fragments hi ha encastat cada bit de marca. Per a la suposició de marcatge, el
5è. bit no el podran canviar. Tot seguit, barregen els seus continguts de manera que les seves
marques queden barrejades com a m3 = 00110011 (m3 "hereta" els bits 1, 2, 5, 7 i 8 de m1
i la resta de m2). Observem que m3 es diferencia en tres posicions de m1 i en quatre de m2,
i, com que el codi corrector d'errors no pot corregir més d'un error, m3 no serà descodificat
ni com a m1 ni com a m2.
© FUOC • PID_00160567 33 Protecció del copyright electrònic

Glossari
capacitat  Màxima quantitat de bits de marca que un sistema de marca d'aigua pot encastar
en un volum de contingut prefixat.

confabulació  En un sistema d'empremta digital, posada en comú de les seves còpies per
part de diversos compradors amb l'objectiu de fabricar una còpia de la qual no es pugui
recuperar la marca de cap dels compradors confabulats.

detecció de còpia  Estratègia que, un cop feta una còpia fraudulenta, cerca d'establir la
identitat de qui ha fet la còpia o bé d'acreditar la propietat intel·lectual del material copiat.

empremta anònima  Sistema d'empremta asimètrica en què el comprador preserva el seu


anonimat durant el protocol d'encast. L'anonimat només es perd en cas que el comprador
faci una redistribució fraudulenta.

empremta asimètrica  Sistema d'empremta digital en què el venedor no veu el contingut


marcat en el moment d'encastar-hi la marca, de tal manera que només el pot conèixer com
a resultat d'haver-ne detectat la redistribució.

empremta digital  Subclasse de tècniques de marques d'aigua en què la marca encastada


és diferent per a cada còpia venuda i n'identifica el comprador.

impediment de còpia  Estratègia que intenta fer impossible la realització d'una còpia,
normalment amb l'auxili del maquinari.

imperceptibilitat  Propietat d'un sistema de marca d'aigua de no alterar la qualitat per-


ceptual dels continguts com a resultat d'encastar-hi la marca.

marca  Informació encastada en el contingut per una tècnica de marca d'aigua.

marca d'aigua  Tècnica de detecció de còpia basada a encastar de manera imperceptible


certa informació de copyright en els continguts que cal protegir.

marca cega  Sistema de marca d'aigua que no requereix el contingut original per a la recu-
peració de la marca.

marca privada  Sistema de marca d'aigua que, per a recuperar la marca, requereix el con-
tingut original i la marca que es vol recuperar.

marca semicega  Sistema de marca d'aigua que, per a recuperar la marca, o bé requereix el
contingut original o bé la marca que es vol recuperar.

redistribució  Còpia no autoritzada per part d'un comprador legal i distribució d'aquesta
a tercers.

robustesa  Propietat d'un sistema de marca d'aigua de ser capaç de recuperar correctament
la marca a partir d'imatges marcades que han sofert manipulacions genèriques independents
del sistema de marca d'aigua emprat.

tamper-proofness   Propietat d'un sistema de marca d'aigua de ser capaç de recuperar cor-
rectament la marca a partir d'imatges marcades que han sofert manipulacions dissenyades
tenint en compte el funcionament dels algorismes d'encast i de recuperació.
© FUOC • PID_00160567 34 Protecció del copyright electrònic

Bibliografia
Cherry, S.M. (2001). "Making Music Pay". IEEE Spectrum. October 2001 (pàg. 41-46).

Katzenbeisser, S.; Petitcolas, F.A.P. (2000). Information Hiding: Techniques for Stegano-
graphy and Digital Watermarking. Artech House.

Sebé, F.; Domingo-Ferrer, J. (2001). "Oblivious image watermarking robust against scaling
and geometric distortion". Information Security, LNCS (2200, pàg. 420-432). Berlín.

Sebé, F.; Domingo-Ferrer, J.; Herrera, J. (2000). "Spatial-domain image watermarking ro-
bust against compression, filtering, cropping and scaling". Information Security, LNCS (1975,
pàg. 44-53). Berlín.

You might also like