You are on page 1of 16

Metoda 1 . Salvare ca HTML filtrat si conversie MOBI cu Calibre.

1. Formatele uzuale ce se preteaza cel mai bine la conversia in formatul MOBI, sunt:

- DOC, DOCX, RTF, EPUB, TXT.

PDF-ul e cel mai problematic la convertire, nu e recomandata convertirea.

2. In cazul acesta vom folosi un fisier DOC/DOCX. Este preferabil ca documentul sa


aiba capitolele/partile setate pe stilul HEADING 1, 2 etc. Desi nu este obligatoriu,
acest lucru permite generarea corecta a unui cuprins.

3. Se acceseaza fisierul, folosind WORD-ul, si se face o convertire (Save as...) in WEB


PAGE, FILTERED. Daca documentul contine si o imagine de coperta, efectuati
salvarea in format html cu coperta stearsa, urmeaza sa fie adaugata in etapa de
convertire a cartii!

Dupa selectarea locatiei de salvare si a formatului de salvare a fisierului (Web Page,


Filtered), este obligatoriu sa accesam meniul Instrumente (imaginile de mai jos). In
fereastra ce apare selectam tabul Codificare, si alegem Unicode(UTF-8). Dupa care
apasam OK si Save.

4. Descarcam CALIBRE. Aici folosim varianta portabila.

5. Executabilul va extrage fisierele in locul ales de utilizator. Urmeaza setarile de


baza ale programului.
Setarea limbii romane este foarte importanta! Cartile ce vor fi convertite pe viitor,
vor fi setate implicit pe limba romana si vor putea fi folosite impreuna cu
dictionarele de limba romana. Daca cartea si dictionarul nu sunt setate pe aceeasi
limba, nu vor putea fi folosite impreuna!

In cazul de fata o sa alegem ca reader Kindle Touch.


Fereastra de mai jos nu necesita completare. Apasati Next.

Apasati Finish.
6. Rularea programului CALIBRE.

7. Folosim butonul Adauga Carti pentru a adauga in CALIBRE fisierul WEB PAGE,
FILTERED.

8. Apoi apasam butonul Converteste Carti. In fereastra ce apare (mai jos) formatul de
iesire (dreapta sus) va fi implicit MOBI, datorita readerului selectat la inceput.
Meniul din stanga, optiunea Metadate, ne permite sa personalizam cartea (nume
autor, descriere etc.).

Pentru adaugarea unei coperti, daca fisierul html nu are deja imaginea inclusa in el,
se cauta o imagine din PC (apasati butonul din dreapta campului Modifica Coperta).
Nu adaugati coperta daca ea exista deja in fisierul html, veti avea 2 poze identice
consecutive! Sterge-ti imaginea din documentul original si apoi salvati ca html!

Daca fisierul html are deja imaginea inclusa in el (trebuie sa fie prima imagine), se
bifeaza optiunea Folositi coperta din fisierul sursa (uneori poate prelua alta imagine
decat cea corecta!).
Submeniul Cuprins (imaginea de mai jos), optiunea Cuprins Nivel 1, trebuie sa
contina: //h:h1 (sau se apasa butonul cu bagheta si se alege formatarea
corespunzatoare). Acest camp e legat de generarea cuprinsului si de folosirea
stilului HEADING 1 in documentul sursa. Daca se foloseste alt stil, e nevoie de alta
setare. Daca nu se foloseste, nu mai e necesara completarea campului Cuprins Nivel
1.
Submeniul Aspect si comportament (imaginea de mai jos), optiunea Sterge spatiul
dintre paragrafe, elimina spatierea dintre paragrafe. Nu afecteaza randurile goale
dintre paragrafe.

In meniul Iesire Mobi (imaginea de mai jos), in campul Titlu pentru Cuprins, scriem
Cuprins sau ceva asemanator, altfel cuprinsul cartii va aparea sub denumirea Table
of Contents. Sau putem bifa optiunea Nu adauga Cuprinsul, iar cartea nu va mai
beneficia de cuprins, acest lucru e recomandat documentelor ce nu au stiluri de
capitole, deoarece Calibre va adauga la cuprins notele de subsol si alte ciudatenii.
9. Dupa ce terminam setarile conversiei, apasam OK, iar programul va converti
fisierele selectate. Aceste fisiere pot fi gasite in locul in care a fost extras CALIBRE:
Calibre Portable\Calibre Library\
Metoda 2.Formatare document si conversie EPUB/MOBI cu Atlantis Word
Processor.

Primii 3 pasi sunt optionali!

1. Fisierul (doc, docx, rtf, txt) este deschis cu Atlantisul. Folositi o copie a fisierului
original! Din clipa in care incepeti prelucrarea cu Atlantis a fisierului, este preferabil sa il
deschideti/salvati numai in Atlantis!

2. Se face formatarea capitolelor (Heading 1, Heading 2 etc.) si remedierea


eventualelor probleme ce se mai gasesc. Se pot incarca si documente gata formatate
in Word cu Heading 1, 2 etc. aceste formatari vor fi pastrate de Atlantis.

3. Dupa ce verificam documentul, il salvam. In acest moment documentul ar trebui


sa contina forma finala a cartii.

4. Daca dorim ca programul Atlantis sa produca si un fisier MOBI, este necesara


descarcarea programului Kindlegen. Poate fi gasit si pe Amazon.com. Arhiva
contine mai multe fisiere, dar ne intereseaza doar executabilul. Acesta va fi copiat in
dosarul in care se afla executabilul Atlantis.

Fisierul MOBI va fi generat automat, imediat dupa salvarea EPUB (vezi mai jos).

5. Salvati documentul in format EPUB. In Atlantis, in meniul File > Save as special >
Save as ebook...

In fereastra ce apare (e mai jos) se alege locatia si numele fisierului epub:


Apoi vor fi facute cateva setari minore, dar obligatorii, a epub-ului:

Se completeaza numele cartii, al autorului (restul sunt optionale).

Se alege coperta cartii, meniul Cover Image permite incarcarea unei imagini deja
existente in document, a unei imagini dintr-o sursa exterioara sau sa nu folositi o
coperta.

In meniul Fonts e preferabil sa alegem Save and Embed. Pentru epub-uri e preferabil
ca fonturile sa fie incorporate in ele. Atentie! Nu toate fonturile arata bine pe
readere/tablete si nu toate se pot mari/micsora fara probleme. Fonturile se
incorporeaza doar daca dorim ca epub-ul sa arate intr-un anumit fel sau daca
contine limbaje straine (de regula, limba romana se numara printre ele).

Apasam pe Save si epub-ul e gata.

Imediat dupa finalizarea fisierului EPUB, Atlantis-ul va lansa si programul


Kindlegen pentru a produce fisierul MOBI. Acesta va rula sub forma unei ferestre
negre, dispare dupa ce salveaza fisierul MOBI.
Cteva sugestii si detalii pentru formatarea documentelor Word, n scopul
convertirii lor n epub-uri/mobi-uri cu aspect corect. Pentru maxim compatibilitate
e bine s se in seama de toate recomandrile, dei unele convertoare, sau ereadere,
sunt mai capabile dect altele.
Lista este rezultatul discuiilor purtate ntre mai muli membri ai forumului, i poate
fi corectat/completat dac vor exista idei noi sau comentarii.
Dimensiunea paginii nu conteaz.
Limea marginilor albe nu conteaz.
Paginile pot fi numerotate sau nu, nu are importan.
Tot documentul se scrie cu acelasi font, inclusiv notele de subsol; un al doilea font
se poate folosi n cazuri excepionale (la titluri sau la citate mai speciale, de
exemplu).
Fontul folosit nu conteaz, nici mrimea lui.
Textul nu se coloreaz, fiindca pe ereaderele non-color se vede "ters".
Nu se folosesc efecte de font (umbrire, reliefare etc.) fiindc se pierd la conversie.
Dac vrem s facem drop-caps, le facem manual, n epub.
Pentru mbuntirea aspectului documentului, dup linia de dialog se pune
Nonbreaking Space (Ctrl-Shift-Space), la fel i dup numrul notelor din subsol.
Nu se folosesc niciodat Enter-uri consecutive; doar n cazuri excepionale se
folosete un singur Enter pentru crearea unui rnd liber.
Salturile la pagin nou nu se fac cu Enter-uri succesive, ci cu un singur Ctrl-Enter.
Pentru acurateea conversiei, nu se folosesc alte liniue decat cratima, en-dash i
em-dash. Nu se folosete non-breaking hyphen (care arat ca o cratim, dar nu e).
Nu se atribuie paragrafelor, indiferent de felul lor, distana "Exactly" ntre linii, ci
se las spaiere "Single", sau cel mult "Multiple" de o valoare aleas.
Mrimea alineatelor se alege 4,5 mm (12 pt) sau maxim 5 mm (14 pt).
Nu are importan dac se desparte sau nu textul n silabe n Word. (Atenie! n
Word desprirea manual n silabe se face cu combinaia de taste Ctrl-Minus.)
Oricum, majoritatea readerelor actuale nu despart n silabe.
Titlurilor li se atribuie stilul predefinit "Heading 1" ( "Titlu 1" ), titlurilor de gradul
al doilea stilul predefinit "Heading 2" ( "Titlu 2" ) .a.m.d. Nu se creeaz stiluri noi
pentru titluri, ci stilurile predefinite se reformateaz dup dorin.
Paragrafelor-titlu li se atribuie i proprietatea "Keep with next".
Paragrafele-titlu nu se separ cu Enter-uri de restul textului, ci cu "Spaiu paragraf
nainte/dup" de valori potrivite.
Numrul de capitol se separ de titlul capitolului cu Shift-Enter, n aa fel inct s
formeze un singur paragraf.
n loc de Manual Page Break, naintea titlurilor e preferabil bifarea proprietii
"Page Break Before" n stilul paragrafelor-titlu.
Dup pagina de titlu se genereaz Cuprinsul, fr afiarea numerelor de pagin.
Din motive practice e bine s limitm cuprinsul la numai dou niveluri.
Pentru compatibilitate cu unele convertoare, tabelele se desfiineaz i se
nlocuiesc cu text formatat (ct de ct).
Nu se deseneaz n Word nimic mai complicat dect linia orizontal.
Figurile se plaseaz n text Inline ( "n linie cu textul" ).
Figurile mai mari de jumtate de A5 se separ de text cu un Ctrl-Enter nainte i
unul dup, ca sa apar singure pe un ecran de reader.

Formatare cu Stiluri:
Natural, Word-ul e orientat pe stiluri, ceea ce inseamna ca orice paragraf din
text are asociat un stil (in cazul in care nu-l definesti tu, il defineste Word implicit ca
Normal).
Are asociat un stil inseamna ca Word tine minte numele stilului si foloseste
elementele de formatare (fontul, dimensiune, identare, etc) definite in acel stil.
Atunci cand salvam in format html, paragraful va arata ceva de genul:

<p classMsoNormal> <span lang=RO> Paragraf de test 1</span></p>


- classMsoNormal e legatura cu stilul folosit, in cazul nostru e stilul Normal

Formatare directa:
Orice modificam prin formatare directa (font, culoare, dimensiune, identare, etc) va
fi memorat de Word individual, in sensul ca va crea descriptori aditionali ai
paragrafului pentru fiecare element de formatare (-> petice diferite). Aceste valori
sunt prioritare celor definite in stil, in sensul ca daca sunt prezente, acestea sunt
folosite iar cele din stil sunt ignorate (au rol de petic peste textura originala).

Exemplu:
Formatez direct fontul unui paragraf la Arial. Atunci cand salvez in html, paragraful
va arata ceva de genul:

<p class=MsoNormal><span lang= RO style='font-family:"Arial","sans-


serif"'>Paragraf de test 1</span></p>

-> S-a adaugat ('font-family:"Arial","sans-serif"') la codul initial (MsoNormal)

Mai schimb si marimea fontului, tot prin formatare directa:

<p class=MsoNormal><span lang= RO style='font-size:12.0pt;font-


family:"Arial","sans-serif"'>Paragraf de test 1</span></p>

-> Am mai adaugat cod ('font-size:12.0pt'), langa cel existent.

In cazul in care mai multe paragrafe sunt formatate direct (selectez o portiune de
text, de exemplu), descriptorii aditionali vor fi creati pentru fiecare paragraf in
parte.
In exemplul de mai sus, daca selectatam tot textul, fiecare paragraf din document va
primi un descriptor aditional style='font-family:"Arial","sans-serif".
-> fiecare paragraf va primi noul sau cod.

Deci, cu cat facem mai multe formatari directe, cu atat devin mai stufosi
descriptorii de formatare ai paragrafelor.

Cum prelucreaza Calibre campurile astea?


La conversie in epub, Calibre adauga clase aditionale de stiluri (CalibreX nu
sunt stiluri in sensul stilurilor Word, dar le numesc asa pentru simplificare). Cu asta
simplifica printre altele si formatarile directe din html-ul folosit la intrare.
In principiu, se uita la toti descriptorii, gaseste elementele comune si creaza clase noi
css. Apoi inlocuieste sirul de elemente din descrierea sirului cu clasa
corespunzatoare.

Rezultatul e un cod html mult mai compact in epub-ul generat.


Exemplu:
<p class="MsoNormal"><span lang="RO" class="calibre6">Paragraf de test
1</span></p>

"Bun, dar codul generat de Atlantis e totusi si mai compact"


Asa este, iar asta e pentru ca Atlantis a ales sa simplifice formatarile directe intr-un
alt mod:
La conversie in epub, Atlantis modifica stilul paragrafului folosit, pentru a ingloba
formatarile directe.
Deci genereaza cod nou, in loc sa mentina textura originala + petic.
Cel mai folosit cod in text este declarat ca implicit, de aceea la majoritatea
paragrafelor nu apare nimic aditional ca si atribute de formatare.
Rezultatul e un cod html si mai compact in epub-ul generat.

Exemplu:
<p>Paragraf de test 1</p>
<p class="p2">Paragraf de test 2</h1>

Destul de interesant facut, si se preteaza foarte bine la carti, unde avem un numar
foarte mare de paragrafe de text normal si un numar mic de paragrafe formatate
altfel (Titluri, motto-uri, etc)

Pe mine unul ma deranjeaza teribil cum arata formatarile astea directe in Word
HTML filtrat
In cazul nostru, rolul lui html_filtrat din Word este de fisier intermediar, folosit
intre Doc si Epub (un capat al procesului e doc-ul, celalalt capat e epub-ul).
Echivalentul lui in cazul folosirii Atlantis-ului, ar fi un fisier temporar, folosit intern
doar de Atlantis la conversia din Doc in Epub.

Bun, si cam ce-ar trebui sa facem acum? Formatam totul cu stiluri si nimic direct,
ca sa avem fisiere html mici?
Formatarile directe nu sunt neaparat gresite, nu e nimic gresit in a le folosi moderat.
E adevarat, reprezentarea interna e mai stufoasa (ne-optimala), se pierde
posibilitatea reformatarii unitare prin modificarea stilului, fisierele salvate vor fi mai
mari.
Atat timp cat soft-ul se descurca cu ele depinde in acest caz de cat de moderat
folosim formatarea directa.
Mai pe scurt:

- pentru producerea unui epub/mobi de calitate este necesar un cod html cat mai
curat posibil, acest cod html depinde foarte mult de formatarea documentului din
care se obtine.

Pentru a intelege mai bine despre ce este vorba va prezint 2 imagini:

- imaginea 1 prezinta codul html dintr-un epub facut dupa prima metoda.

- imaginea 2 prezinta codul html dintr-un epub facut dupa a doua metoda.