Professional Documents
Culture Documents
copyright
electrònic
Josep Domingo Ferrer
Francesc Sebé Feixas
PID_00160567
© FUOC • PID_00160567 Protecció del copyright electrònic
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada,
reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com
químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització
prèvia per escrit dels titulars del copyright.
© FUOC • PID_00160567 Protecció del copyright electrònic
Índex
Introducció.................................................................................................. 5
Objectius....................................................................................................... 6
Resum............................................................................................................ 30
Activitats...................................................................................................... 31
Exercicis d'autoavaluació........................................................................ 31
Solucionari.................................................................................................. 32
Glossari......................................................................................................... 33
© FUOC • PID_00160567 Protecció del copyright electrònic
Bibliografia................................................................................................. 34
© FUOC • PID_00160567 5 Protecció del copyright electrònic
Introducció
En aquest mòdul didàctic donarem els fonaments per a entendre les tècniques
de protecció de la propietat intel·lectual de la informació multimèdia objecte
de transacció electrònica.
Objectius
Els materials didàctics d'aquest mòdul us han de permetre d'assolir els objec-
tius següents:
"First, there's the room you can see through the glass -that's
just the same as our drawing room, only the things go the other way."
L. Carroll (1872). Through the Looking Glass And What Alice Found There (cap. 1).
Quan s'associa un valor econòmic a una certa informació digital (per exemple,
una cançó MP3, una pel·lícula MPEG, etc.), la no-degradació de les còpies es-
devé per al propietari intel·lectual de la informació més un problema que un
avantatge. Aquesta situació es produeix en el comerç electrònic de continguts
multimèdia.
En el cas extrem, podria arribar a passar que el propietari del contingut només
en vengués una còpia i que, a partir d'aquest moment, es fessin tot de còpies
il·legals.
Del que hem dit anteriorment, se'n desprèn l'extrema importància de prote-
gir-se contra la còpia no autoritzada d'informació en format electrònic. La pro-
tecció de la propietat intel·lectual en la societat de la informació ha estat un
dels objectius del cinquè programa marc d'R+D de la Unió Europea.
© FUOC • PID_00160567 8 Protecció del copyright electrònic
• Impediment de la còpia
• Detecció de la còpia
a)�Impediment�de�còpia
En última instància, per a impedir la còpia, cal que els dispositius reproductors
i gravadors de contingut multimèdia incorporin unes certes mesures anticòpia
en el seu maquinari.
El trencament de les mesures anticòpia dels discos compactes (CD), de les tele-
visions xifrades de pagament i, darrerament, dels discos de vídeo digital (DVD)
són exemples del fracàs clamorós de l'estratègia d'impediment de còpia.
© FUOC • PID_00160567 9 Protecció del copyright electrònic
Al sistema DVD, els continguts del vídeo hi incorporen uns bits d'informació anticòpia.
Un reproductor DVD que s'ajusti a les especificacions no copiarà dades que portin uns
bits anticòpia amb el significat ‘no copien'.
Si els bits anticòpia duen el significat ‘copiar una vegada', aleshores el reproductor per-
metrà de copiar les dades una vegada, però, a partir de la còpia, no se'n podrà fer d'altres
(la còpia portarà uns bits anticòpia dient ‘no copien').
Per tal d'evitar el canvi no autoritzat dels bits anticòpia per part de tercers, el sistema DVD
preveu el xifratge dels continguts mitjançant un criptosistema (molt feble) anomenat
Content Scrambling System (CSS). Doncs bé, resulta que, el 1999, uns intrusos (hackers)
alemanys i noruecs van posar a Internet el programa DeCSS, que permet de desxifrar i
llegir continguts DVD, amb la qual cosa és fàcil alterar-ne els bits anticòpia i saltar-se el
mecanisme d'impediment de còpia.
b)�Detecció�de�còpia
1) Per a encastar un bit de la marca, cal un fragment dels continguts que cal
protegir, del qual hi hagi dues versions lleugerament diferents. En aquest con-
text, la diferència entre versions es considera lleugera si és imperceptible per a
l'usuari del contingut. Si es fa servir la primera versió, es codifica un "0" com a
valor del bit de marca corresponent; si es fa servir la segona versió, es codifica
un "1".
2) Quan es ven una còpia del contingut, el venedor tria un valor per a cada
bit de la marca i fa servir les versions pertinents dels fragments corresponents
als bits per a construir un contingut marcat.
El procediment per a recuperar una marca a partir d'un objecte marcat redis-
tribuït està representat a la figura 2 i té, com a paràmetres d'entrada, l'objecte
redistribuït ', la clau secreta K emprada durant l'encast i, segons les propie-
tats de l'esquema de marca d'aigua utilitzat, algun paràmetre addicional.
Noteu que és possible que l'objecte marcat redistribuït ', pres com a entrada
per al procediment de recuperació, no correspongui exactament a cap objecte
marcat ' segons el procediment d'encast. En efecte, entre el moment de mar-
car-lo i el moment en què se'n detecta la redistribució, el contingut pot haver
sofert algunes manipulacions. Per tant, és possible (tot i que no és desitjable)
que la marca recuperada M' no correspongui a la marca realment encastada M.
"Il faut qu'il n'exige pas le secret, et qu'il puisse sans inconvénient tomber entre les mains
de l'ennemi."
A. Kerckhoff (1883, gener). "La cryptographie militaire". Journal des Sciences Militaires (9,
pàg. 5-38).
Fins ara hem dit que cal encastar la marca d'aigua en els continguts que cal
protegir. En aquest apartat incidirem en el fet que cal fer-ho bé.
• Robustesa: es diu que un sistema de marca d'aigua és robust contra un cert Atac
atac de manipulació si, després d'atacar el contingut marcat amb aquesta
Una atac és qualsevol alteració
manipulació, encara se'n pot recuperar la marca que s'hi va encastar abans realitzada a un objecte mar-
de l'atac. cat amb l'objectiu de fer que
la marca deixi de ser recupera-
ble.
Els atacs d'un sol usuari són realitzats per un sol comprador de manera acci- Atacs de confabulació
dental o intencionada.
Els atacs de confabulació no-
més tenen sentit en els siste-
Exemple d'atac d'un sol usuari mes d'empremta digital (en
què les marques encastades
Si els continguts són imatges, els atacs poden consistir en compressió amb pèrdua, dis- són diferents per a cada cò-
torsió geomètrica (rotació, escalat, estirament, etc.), filtratge passabaix... De fet, per al pia). Els tractarem més enda-
vant.
cas de les imatges, hi ha un programa benchmark de domini públic, anomenat StirMark,
que efectua una bateria d'atacs estàndard per a provar la robustesa dels sistemes de marca
d'aigua (vegeu les activitats al final del mòdul).
Noteu que, en el cas de les empremtes digitals, la marca d'aigua encastada és diferent per
a cada còpia venuda, amb la qual cosa és concebible que uns compradors confabulats
aconsegueixin localitzar i/o alterar alguns bits de la marca encastada a força de comparar
i/o barrejar les seves còpies respectives. La confabulació triomfa si la marca recuperada
de la còpia barrejada no correspon a cap dels confabulats.
En altres paraules, la suposició anterior vol dir que els dissenyadors de siste-
mes d'empremta digital es concentren a trobar codificacions de les marques
encastades que els permetin de superar atacs de confabulació. Quant a la res-
ta d'atacs, suposen que el sistema de marca d'aigua amb el qual s'encasten i
recuperen les marques és prou robust per a superar-los.
• Una codificació de les marques que cal encastar que els permeti de sobre-
viure als atacs de confabulació previstos en la suposició de marcatge.
© FUOC • PID_00160567 14 Protecció del copyright electrònic
Per a classificar els sistemes de marca d'aigua existents, ens fixarem en els pa-
ràmetres d'entrada que requereix el seu algorisme de recuperació de marca.
Òbviament, aquest algorisme sempre requereix com a entrades el contingut
marcat redistribuït i també la clau secreta usada durant l'encast (vegeu la figu-
ra 1). Són els paràmetres d'entrada addicionals els que ens permeten de fer la
classificació següent:
• Sistemes�cecs: són aquells que poden recuperar la marca amb només els
dos paràmetres d'entrada esmentats anteriorment, el contingut marcat
redistribuït ' i la clau secreta K. Es tracta dels sistemes més flexibles, per
bé que no els més robustos.
(2)
El concepte d'empremta digital2 fou proposat per N.R. Wagner el 1983. Al fi- En anglès, fingerprinting.
nal dels anys noranta, van aparèixer nous sistemes d'empremta digital, amb
la qual cosa el concepte de Wagner fou "rebatejat" com a empremta digital si-
mètrica. Actualment, podem distingir els tipus de sistemes d'empremta digital
següents (alguns d'aquests tipus no són mútuament excloents):
• Sistemes�asimètrics: foren proposats per Pfitzmann i Schunter el 1996 per Problemes pràctics
tal d'obtenir una prova de redistribució. L'algorisme d'encast de marca ja
Les propostes de sistemes asi-
no l'executa el venedor tot sol, sinó que és un protocol en el qual coope- mètrics de Pfitzmann i altres es
ren venedor i comprador. El protocol és tal que el venedor no veu la cò- basen en el càlcul segur a múl-
tiples bandes, una tècnica que,
pia marcada resultant, però, quan la troba redistribuïda (per Internet, per tot i ser possible en teoria, és
molt difícil d'implementar en
exemple), pot recuperar-ne la marca encastada i, per tant, la identitat del la pràctica. El 1999, Domin-
go-Ferrer proposà fer servir
comprador. Com que el comprador és l'únic que coneix la còpia marcada, l'eina criptogràfica de la trans-
llevat que la redistribueixi, el coneixement de la còpia marcada per part ferència inconscient, proposta
que té una complexitat quan-
del venedor és una prova acusatòria contra el comprador. tificable, però que continua es-
sent massa elevada.
Etimologia de píxel
Des d'un punt de vista de processament informàtic, una imatge�digital
consisteix en una matriu de dues dimensions en què cada element conté El mot anglès pixel prové de
l'acrònim transformat dels
informació sobre un punt de color. Aquests punts són els anomenats mots picture element.
píxels. Els nombres de files i columnes d'aquesta matriu corresponen a
l'amplada i l'alçada de la imatge, respectivament.
A causa de l'elevada quantitat d'informació continguda en una imatge, els fit- La mida de les imatges
xers necessaris per al seu emmagatzematge tenen una mida massa gran perquè
Una imatge corresponent a
siguin còmodes de manipular i transportar. És per això que habitualment les una fotografia en color de
imatges s'emmagatzemen en formats de fitxer que apliquen una compressió. 1.024 files i 1.024 columnes
en què cada nivell de color es
representa amb un enter d'1
byte ocupa un total de 1.024
Hi ha dos tipus de compressió: × 1.024 × 3 = = 3.145.728 by-
tes. Aquesta mida ja és prou
gran per a no poder emmagat-
• Sense pèrdua: compressió en què la informació recuperada després de des- zemar-la en un disquet de 3,5
polzades.
comprimir és exactament la mateixa que abans de comprimir.
Ja s'ha esmentat que la robustesa d'un sistema de marca d'aigua preveu la re-
sistència de la marca contra les manipulacions no intencionades que pot ex-
perimentar l'objecte durant el seu cicle de vida.
© FUOC • PID_00160567 18 Protecció del copyright electrònic
Convé, doncs, que els sistemes de marca d'aigua siguin robustos contra aquests
tipus de manipulació.
Tal com s'ha dit amb anterioritat, l'encast d'una marca d'aigua dintre de contin-
guts multimèdia es fa realitzant petits canvis al producte. En el cas de les imat-
ges, aquestes modificacions afecten el nivell de color dels píxels de la imatge.
3. Encastar la marca.
En aquest sistema, l'entitat que vol encastar una marca d'aigua ha de propor-
cionar el valor dels paràmetres següents:
• La marca que cal encastar. Consisteix en una seqüència binària que deno-
tarem m.
1)� Determinació� dels� píxels� de� la� imatge� en� què� s'encastaran� bits� de� la
marca.
Cal que tinguem en compte que la imatge X' serà lleugerament diferent a X,
a causa que l'algorisme JPEG aplica compressió amb pèrdua.
2)�Determinació�de�la�modificació�aplicable�a�cada�píxel
© FUOC • PID_00160567 20 Protecció del copyright electrònic
En aquesta fase, s'utilitzen els valors calculats a la fase anterior. A cada píxel
3)�Encast�de�la�marca
a) Es codifica m utilitzant un codi corrector d'errors. La seqüència codificada Codi corrector d'errors
resultant, l'anomenarem M.
Codi que permet, mitjançant
la redundància, la correcció
b) Es replica la seqüència codificada M tants cops com sigui necessari fins a per part del receptor d'un mis-
satge amb possibles errors que
obtenir una seqüència de longitud igual al nombre de píxels de la imatge amb aquest hagi pogut tenir.
={ i, 1 ≤ i ≤ n}.
• Si δi = 0 aleshores i : = xi
• Si δi ≠ 0 aleshores
– Calcular j: = j + 1
© FUOC • PID_00160567 21 Protecció del copyright electrònic
– Si S'j = 0 aleshores i: = xi – δi
– Si S'j = 1 aleshores i: = xi + δi
• Si i – xi > 3 aleshores i: = i – 1.
• Si i – xi < –3 aleshores i: = i +1 .
1)�Determinar�els�píxels�on�està�encastat�cada�bit.
2)�Recuperar�els�diferents�bits�de�la�marca.
b) A continuació, s'inicialitzen dos vectors uns [.] i zeros [.] de mida inici-
alitzant totes les posicions a zero. La funció d'aquests dos vectors és comptar,
per cada bit de , quants cops es recupera amb valor 1 i quants cops amb
valor 0.
e) Sigui j: = 0.
En els passos (II) i (III) es determina quin bit conté el píxel i. Si la imatge de
la qual volem recuperar la marca no ha estat alterada, aleshores i = xi ± δi
Observeu que una alteració en un píxel li fa canviar el valor del bit encastat
solament si el signe de ( i) es veu modificat. Aquest fet fa que el mètode toleri
determinades alteracions.
A continuació,
3)�Comprovar�que�la�marca�és�correcta
Generalment, els formats de compressió de vídeo aconsegueixen taxes de com- Taxa de compressió
pressió més altes que les d'imatge ja que aprofiten la redundància temporal.
Quocient entre la mida del fit-
Tot i això, la mida d'un fitxer de vídeo comprimit amb una qualitat acceptable, xer original i la mida del fitxer
es compta per desenes de megabits, depenent de la seva durada i del format comprimit.
de compressió utilitzat.
A causa que un vídeo pot tenir so, l'encast de marca es pot realitzar tant en el
flux d'imatge com en el de so, com en tots dos.
Les modificacions per a encastar una marca en un flux d'imatge es poden fer
de dues maneres:
• Aplicant modificacions als píxels dels diferents fotogrames. Fer-ho així re-
sulta molt costós en el temps, perquè, per a marcar cada fotograma, pri-
mer cal descomprimir-lo, després encastar-hi la marca i després tornar-lo
a comprimir. D'altra banda, és una tècnica més portable, ja que no depèn
del format de compressió utilitzat.
Independentment dels fluxos en què encastem la marca (imatge i/o so) o de si Classificació dels sistemes
ho fem directament sobre els píxels dels fotogrames o sobre la seva represen-
En l'apartat "Classificació de
tació comprimida, cal que el sistema utilitzat sigui cec o semicec, en aquest se- sistemes de marca d'aigua"
gon cas només en la variant que requereix conèixer la seqüència que busquem. trobareu les definicions de sis-
tema cec o semicec.
Cal que un sistema de marca d'aigua per a vídeo suporti les modificacions que
se li poden fer.
• Canvi de format.
• Compressió.
1) En cas que el vídeo també contingui àudio, es fa una separació dels dos
fluxos.
• Se'l descomprimeix.
• Se'l marca.
1) En cas que el vídeo també contingui àudio, es fa una separació dels dos
fluxos.
© FUOC • PID_00160567 26 Protecció del copyright electrònic
• Se'l descomprimeix.
• Se li aplica l'algorisme de recuperació de marca.
• En cas de trobar una marca, ho registrem.
3) A partir dels resultats obtinguts, decidim si s'ha trobat una marca i quina
és aquesta.
Tal com hem fet en la descripció del sistema anterior, denotarem la imatge com
X = {xi : 1 ≤ i ≤ n}, en què n és el nombre de píxels de la imatge i xi és el nivell
de color de l'i-èsim píxel. També suposarem que la imatge és monocroma i,
per tant, cada píxel solament conté un enter d'informació de nivell de gris.
Igual que en el cas anterior, l'extensió del sistema per imatges en color és ben
senzilla, simplement aplicant la tècnica a cadascun dels plans de color per
separat.
• La marca que cal encastar. Consisteix en una seqüència binària que deno-
tarem m.
1)�Determinació�dels�píxels�de�la�imatge�on�s'encastaran�els�bits�de�la�mar-
ca
Per a fer això, primer es codifica la marca m utilitzant un codi corrector d'errors.
La seqüència resultant, l'anomenarem M. La longitud de M, la denotarem com
a .
2)�Determinació�de�la�modificació�aplicable�a�cada�píxel
© FUOC • PID_00160567 27 Protecció del copyright electrònic
En aquesta fase, s'utilitzen els paràmetres lb1 , ub1 , que prenen valors enters
i que s'utilitzen per a afitar inferiorment i superiorment la variació del nivell
de color dels píxels.
També s'utilitza dt, que correspon a un llindar a partir del qual els nivells de
color inferiors a aquest es consideren foscos.
Suposant que cada nivell de color pot prendre un valor entre 0 i 255, una bona
tria és dt = 70, lb1 = 2, ub1 = 11.
= max /2, per a tots els píxels xj que són veïns de xi sobre la imatge.
nhi es pot veure com una mena de derivada discreta al píxel i. Observeu que
nhi serà més gran en aquells píxels que tenen un nivell de color més diferent
respecte als seus veïns. Això passa en regions no homogènies de la imatge.
Aleshores, s'afita el valor de nhi entre lb1 i ub1 fent la correcció següent:
b) Per a cada píxel xi de la imatge, es calcula la seva foscor amb di: = (dt-xi)*ub1
/dt si xi <dt i di: = 0, altrament. Un píxel es considera fosc si el seu nivell de
color és inferior a dt. El valor di està entre 0 i ub1. Observeu que di val 0 per
xi = dt i va augmentant linealment fins a ub1 a mesura que el nivell de color
del píxel xi va disminuint.
c) Finalment, es calcula la component visual del píxel xi amb Vi: = max(nhi, di).
3)�Encast�de�la�marca
En aquesta fase s'utilitzen els paràmetres lb2 i ub2. Suposant que cada nivell de
color pot prendre un valor entre 0 i 255, una bona tria és lb2 =10 i ub2 =13.
L'entitat que vol recuperar la marca d'una imatge ha de proporcionar els pa-
ràmetres lb2, ub2 i la clau secreta k . També ha de conèixer la longitud de la
seqüència que es busca. Denotarem la imatge presumptament marcada de la
qual volem recuperar la marca com a = i, 1 ≤ i ≤ n.
1)�Determinar�els�píxels�on�està�encastat�cada�bit.34
2)�Recuperar�els�diferents�bits�de�la�marca.
Aquest primer pas s'aplica per a cadascuna de les rajoles en què hem dividit
la imatge.
3)�Comprovar�que�la�marca�és�correcta.
Resum
Les propietats que ha de tenir un bon sistema de marca d'aigua són, entre
d'altres, robustesa, capacitat, imperceptibilitat i mínim�secret.
Cap dels dos estudis de cas presentats no requereix que el recuperador de marca
conegui a priori quina marca vol recuperar, per la qual cosa són utilitzables per
a aplicacions d'empremta digital.
© FUOC • PID_00160567 31 Protecció del copyright electrònic
Activitats
1. Implementeu un sistema de marca d'aigua semàntica per a textos ASCII en català. Heu de
definir parelles de sinònims per a paraules habituals (per exemple, llavors i aleshores). Quan
trobeu una paraula al text que té un sinònim, per a encastar un bit 0, agafeu el primer sinònim
de la parella i, per a encastar un bit 1, agafeu el segon sinònim. La clau secreta és, en aquest
cas, la llista de parelles de sinònims que feu servir i la convenció de quina codifica un 1 i
quina un 0.
Exercicis d'autoavaluació
1. Suposeu que feu servir el sistema de marca d'aigua semicec explicat en el primer estudi de
cas. Suposeu que enfosquim una imatge en blanc i negre marcada dividint el nivell de gris de
tots els píxels per dos. Seria possible que l'algorisme de recuperació recuperés correctament
la marca a partir de la imatge enfosquida?
2. Amb el sistema de marca d'aigua cec del segon estudi de cas, es recupera correctament la
marca si la imatge marcada ha sofert una petita rotació (posem per cas de 2 graus)?
Solucionari
Exercicis�d'autoavaluació
2. Mentre la major part dels píxels que hi havia a cada rajola abans de la rotació hi continuïn
essent després de la rotació, es podrà extreure el bit de marca correcte a partir dels píxels de
la rajola. Si la rotació és petita, la majoria de píxels continuaran a la seva rajola i la marca
serà recuperada correctament.
Glossari
capacitat Màxima quantitat de bits de marca que un sistema de marca d'aigua pot encastar
en un volum de contingut prefixat.
confabulació En un sistema d'empremta digital, posada en comú de les seves còpies per
part de diversos compradors amb l'objectiu de fabricar una còpia de la qual no es pugui
recuperar la marca de cap dels compradors confabulats.
detecció de còpia Estratègia que, un cop feta una còpia fraudulenta, cerca d'establir la
identitat de qui ha fet la còpia o bé d'acreditar la propietat intel·lectual del material copiat.
impediment de còpia Estratègia que intenta fer impossible la realització d'una còpia,
normalment amb l'auxili del maquinari.
marca cega Sistema de marca d'aigua que no requereix el contingut original per a la recu-
peració de la marca.
marca privada Sistema de marca d'aigua que, per a recuperar la marca, requereix el con-
tingut original i la marca que es vol recuperar.
marca semicega Sistema de marca d'aigua que, per a recuperar la marca, o bé requereix el
contingut original o bé la marca que es vol recuperar.
redistribució Còpia no autoritzada per part d'un comprador legal i distribució d'aquesta
a tercers.
robustesa Propietat d'un sistema de marca d'aigua de ser capaç de recuperar correctament
la marca a partir d'imatges marcades que han sofert manipulacions genèriques independents
del sistema de marca d'aigua emprat.
tamper-proofness Propietat d'un sistema de marca d'aigua de ser capaç de recuperar cor-
rectament la marca a partir d'imatges marcades que han sofert manipulacions dissenyades
tenint en compte el funcionament dels algorismes d'encast i de recuperació.
© FUOC • PID_00160567 34 Protecció del copyright electrònic
Bibliografia
Cherry, S.M. (2001). "Making Music Pay". IEEE Spectrum. October 2001 (pàg. 41-46).
Katzenbeisser, S.; Petitcolas, F.A.P. (2000). Information Hiding: Techniques for Stegano-
graphy and Digital Watermarking. Artech House.
Sebé, F.; Domingo-Ferrer, J. (2001). "Oblivious image watermarking robust against scaling
and geometric distortion". Information Security, LNCS (2200, pàg. 420-432). Berlín.
Sebé, F.; Domingo-Ferrer, J.; Herrera, J. (2000). "Spatial-domain image watermarking ro-
bust against compression, filtering, cropping and scaling". Information Security, LNCS (1975,
pàg. 44-53). Berlín.