TIPURI DE DATE



Informatii de tip text, audio, imagine, video

 

Textul

Scrisul a fost inventat cu aproximativ 6000 de ani in urmă si a fost folosit de unele popoare orientale antice in Mesopotamia, Egipt Sumeria si Babilonconsistă din cuie săpate în piatră sau imprimate pe tăblite de argilă, folosit de unele popoare orientale anticePrimele semne au aparut de ani . Astazi simbolurile folosite pentru scriere se diferentiaza mai mult sau mai putin de la o limba la alta.

Textul stocat in format digital presupune folosirea unui calculator si utilizarea unor aplicatii specifice prelucrarii textului. El poate fi reprezentat prin puncte pe o retea de linii orizontale si verticale.

Un editor de text este o aplicaţie software folosită pentru introducerea unui text simplu, fără să îndeplinească funcţii precum aşezarea în pagină a textului sau alte caractere speciale.

Un procesor de text sau un sistem de pregătire a documentelor, este o aplicaţie software folosită pentru producerea de orice tip de material destinat tipăririi respectiv editare, compoziţie, aşezare în pagină eventual funcţii specifice în crearea de asistată de calculator a publicaţiilor (aplicaţii DTP -Desktop Publishing).

Pentru reprezentarea textului se folosesc mai multe tipuri de marimi si stiluri ale caracterelor cuprinse intr-o familie de caractere grafice numita Typeface.

Fontul este un set complet de caractere avand o singura marime(data in puncte) si un anumit stil ( aldin, oblic, subliniat, centrat etc.) care apartine unui anumit typeface. De exemplu toate caracterele de 9 puncte Courier reprezinta un font si cele de 10 puncte reprezinta alt font. Courier regular, Courier italic, Courier bold si Courier bold italic sunt 4 fonturi dar un singur Typeface.Marimea unui caracter este data in puncte, un punct fiind de 0,0138 inci.

Cele mai utilizate familii TypeFace sunt familiile serif (Palatino, Times, Bookman, etc.) si sans serif (Arial, Helvetica, etc.). Serif este o mica terminatie situata la extremitatea literei.

Kerningul (distanta dintre litere) si anti-aliasingul (tranzitie fina intre litera si fondul pe care este reprezentata) sunt doua dintre prelucrarile care se pot face asupra textului.

In 1985 firma Apple introduce un soft care permite desenarea formei unei litere pe baza geometriei prin metode matematice (curbe besier) folosind limbajul PostScript. Aceste fonturi se numesc PostScript si pot fi Type 1 si Type3 si pot fi marite sau micsorate fara ca aspectul caracterului sa fie afectat.

Tot Apple propune folosirea fonturilor True Type care utilizeaza curbele cuadratice in reprezentarea caracterelor.

Astazi datorita extinderii internetului la nivel mondial si raspandirii documentelor multimedia, cele mai utilizat formate pentru documente care permit si folosirea caracteristicilor hypermedia si hypertext sunt documentele HTML si PDF.

PDF -(Portable Document Format) este un format de fisier creat de Adobe Systems în 1993)

Sunetul

Sunetul este o vibratie mecanica propagata (sub forma unei unde) intr-un mediu elastic. Exista si vibratii la frecvente din afara domeniului de sensibilitate al urechii: infrasunete (sub 20 Hz) si ultrasunete (peste 20 kHz).

Sunetele variaza in:

- intensitate (masurata in decibeli - dB);

- frecventa care reprezinta numarul de vibratii pe secunda (masurata in hertz -Hz).

Sunetele rezultate din vorbire sau grupurile de sunete (cuvintele) pot fi redate cu ajutorul unui PC, cu alte cuvinte, vorbirea pot fi recunoscute si redate de un calculator.

Sunetele rezultate din vorbire sau simplele zgomote pot fi preluate pe PC prin intermediul unui microfon iar muzica orin intermediul unui sintetizator.

Sunetele naturale sunt semnale analogice cu variatie continua si sunt transformate in semnale digitale cu variatie discreta prin preluarea cuantificata a sunetului adica prin esantionarea a fiecarei a n-a fractiune dintr-o secunda de sunet analogic si codificarea lui binara.

Fiecare esantion este stocat ca informatie digitala pe 8 sau 16 biti adica despre cuantificarea amplitudinii sunetului pe o scara de 256 de nivele (la codificarea pe 8 biti) si respectiv 65536 (la codificarea pe 16 biti). Se poate vorbi de rata de esantionare care reprezinta cat de des sunt inregistrate esntioanele de sunet si de marimea esantionului adica de cantitatea de informatie stocata intr-un esantion. Cu cat este mai mare rata de esantionare cu atat se obtine o calitate mai fidela a sunetului.

esantionare

fig. Esantionarea semnalului sonor

Frecventele folosite pentru esantionare sunt:

- 11,025 KHz pentru inregistrarile prin telefon sau microfon

- 22,05 KHz pentru inregistrarile de pe casete

- 44,1 KHz pentru inregistrarile de pe Cd audio

O alta forma de preluare a sunetelor este reprezentarea simbolica. Sunetele preluate de la sintetizator sunt reprezentate simbolic conform standardului MIDI (Musical Instrument Digital Device) prin care s-au definit modul de codificare a elementelor portativelor muzicale (note, durata etc.) pentru o serie de 127 de instrumente muzicale ( 7 tipuri de piane, 8 tipuri de ghitare, corn francez, flaut, ciripit etc.)

Exista doua aspecte in ce priveste procesarea sunetului rezultat din vorbire (pe calculator) si anume de:

- recunoasterea sunetului (computer speech recognition) convertirea cuvintelor vorbite in date digitale(binare) recunoscute de calculator;

- intelegerea sensului sunetelor rezultate din vorbire (speech understanding).

Intelegerea vorbirii este un domeniu in cercetare, exista astfel un program sponsorizat de Defense Advanced Research Projects Agency (DARPA) in U.S. orientat spre realizarea unei interfete de vorbire, adica spre procesarea limbajului natural prin intermediul calculatoarelor.

Imaginea

Imaginile pot fi reprezentate sub forma matriciala(bitmap) sau vectoriala(graphics).

Imaginea bitmap este o matrice bidimensionala alcatuita din pixeli codificati pe un anumit numar de biti si este folosita pentru imagini complexe. Fiecare pixel capata o anumita culoare dintr-un spectru variabil și este memorat ca un numar, ce va fi înregistrat intern într-o serie de biti. Cu cât numarul de biti alocati este mai mare, cu atât creste posibilitatea de a afisa nuante coloristice mai apropiate de realitate.

Numarul de biti folosit pentru codificarea unui pixel sunt:

1 - pt. imagini alb-negru

2 -pt. imagini 4 nuante de gri

4 -pt. imagini in 32 de nuante de gri

8 -pt. 256 de nuante

16, 24, 32.

Prin compresia imaginilor bitmap se obtine o degradarea a acesteia proportionala cu rata de compresie.

Imaginile vectorilae care sunt reprezentate prin unghiuri, coordonate si distante folosind obiecte pentru mentinerea informatiilor structuralespre deosebire de imaginile bitmap care ignora continutul semantic.

Imaginile se pot obtine:

- prin crearea (desenarea) lor cu un soft specific(ex. Paintbrush, Fireworks, Photoshop)

- captarea imaginii de pe ecran;

- prin scanare;

- conversia unei imagini vectoriale intr-o imagine bitmap;

- de pe un aparat foto digital, camera video digitala, camera web.

Conversia imaginilor bitmap in imagini vectoriale presupune recunoasterea formelor adica pattern recognition ceea ce se foloseste in cazul OCR-izarii unui text.

OCR - Optical Character Recognition.

Cele mai utilizate formate de fisiere pentru informatii multimedia:

1.Formate audio:

MP3 - Mpeg Audio Layer- 3

AU - format intependent de platforma

MIDI- Musical Instrument digital Device

WAVE- pentru platformele Windows

AIFF - Audio Interchange File Format

2.Formate imagine:

BMP- Bitmap ( o imagine necomprimata realizată dintr-o retea de puncte sau pixeli - hartă de biti)

GIF - Graphics Interchange Format ( pt imagini care nu necesita o fidelitate perfecta cu un numar de culori mai mic de 256)

JPEG - Joint Photographic Experts Group

TIFF (Tag Image File Format)

TGA - Targa or Truevision Graphics Adapter

3.Formate video:

WMA - Windows Media Audio

AVI - Audio-Video Interleaved

WMV - Windows Media Video

MPEG - Motion Picture Experts Group

MOV - QuickTime

ASF - Advanced Streaming Format

3GP - mobile phone video format

MP4