電子文件的特點之一就是多種信息媒體的集成性,檔案工作者不僅可以保管和隨時查閱各種文本信息,還可以儲存和使用聲音、圖片、視頻等多種媒體的電子文件,這不能不說是一種媒體的革命,也是電子文件優越性的表現。
不同種類的電子文件不僅在系統中的存儲結構復雜,各種類型的電子文件格式在功能實現上也極其不同,可以說是種類不同,創建者在制作過程中的思維方式也是完全不同的,而對于使用者來說需要用完全不同的方式來管理和利用。
一、文本格式文件的管理方法
計算機中儲存文字文件的格式屬于文本格式類型電子文件,通常采用TXT格式來管理文本文件。計算機以二進制方式工作,它的全部字符也是用二進制來表示,那么就可以稱這些二進制數是字符的編碼。在計算機上常用的一種編碼是ASCII碼(American Standard Code for Information Interchange),稱作美國信息交換標準碼。而漢字在計算機中是以點陣形式存儲的,通常有16×16,24×24,48×48點陣等。供屏幕顯示用的漢字是16×16點陣,打印用漢字一般是24×24點陣。一個16×16點陣的漢字在計算機中是用256個點來表示,這256個點按橫16個點、豎16個點排列成一個正方形域,每個點用二進制數0或1表示,其中有筆劃經過的點為1,無筆劃經過的點為0。這樣一個16×16點陣漢字存儲在計算機中占用32個字節(每行16位二進制數,占兩個字節,共16行)。人們把常用漢字和符號以這種方式存儲在計算機的存儲器中就形成漢字字庫。
在Windows下的漢字字庫其實就是顯示文字的字體集合,每一種字體獨立而成一個字庫文件,計算機顯示漢字就是從使用者選定的字體的字庫文件中通過一一對應的關系映射到屏幕的文字。而存儲這些文字和符號的文件就被稱為文本文件,僅儲存文本信息的文件就被稱之為純文本文件,就是通常使用的TXT文件。
純文本文件的擴展名就是TXT,使用者在Windows下可以用記事本打開查看和編輯(DOS下用edit命令的文本編輯器)TXT格式的文件。常用的Word、WPS等辦公軟件雖然也可以查看和編輯文本文件,但這些強大的字處理軟件往往同時保存著許多文字的格式信息以及各種圖片、聲音、視頻剪輯、圖表等,因此它們生成的電子文件無法稱之為純文本文件。因此,如果要保存純文本文件不建議采用辦公處理軟件儲存文本文件。純文本的TXT文件除了用記事本等純文本編輯器管理外,它還可以通過相關的程序與辦公系統或檔案管理系統等軟件關聯,通過程序語言可以簡單的把文本符號從TXT文件中讀取出來供管理者在系統中利用和處理。TXT純文本文件有著自己獨特的優勢,它是體積最小、計算機處理速度最快的一種信息儲存格式,甚至某些大型管理系統直接面對TXT文件處理數據信息。檔案工作者在實際工作中可以直接把檔案的文字信息錄入記事本軟件中編輯處理,這樣無論今后辦公自動化軟件和計算機硬件技術如何升級換代,管理者采用的TXT文本文件永遠不會不兼容。
很多檔案文件需要更復雜的文字表現格式,如紅頭文件的頁面就無法用TXT格式來表現,有些檔案文件最好不通過任何系統處理就與配圖和配樂等多媒體文件相關聯,這樣就要用到其它格式的文本來儲存。根據《電子文件歸檔與管理規范》(GB/T 18894-2002)規定的文本文件通用格式,除了TXT格式之外,還有XML和RTF格式。后兩者的出現就是為了解決文本格式的編輯及文本與其他媒體格式文件關聯的問題,這兩種格式的文本文件通常都是通過超文本的標簽語句儲存標識出文本內部的不同信息,真正做到文字的元數據與純文本相分離并協調工作。具體來說,就是XML文件包括標簽在內的所有信息都是純文本格式的,但就是因為XML可以用純文本的標簽標識純文本信息,使這些被標識的數據與它們自身的數據相分離,做到同樣的數據通過不同的元數據輔助在解析器中可以生成不同效果的整體文件。雖然最終解析器表現出來的是多媒體甚至超媒體信息,但實際上該信息中的文本與元數據都是獨立存在的,而且它們都是純文本的,這就是XML真正優越的地方。檔案工作者同樣可以使用記事本來編輯XML文件,但因為標簽隊列的復雜性,通常可以采用XML專用的文本編輯器來編輯,如XML Explorer等軟件。RTF格式文件本身就是靜止的XML文件,但RTF通常用于保存單獨儲存的文本文件,這種情況常見于對WORD格式文件的轉化以及獨立內容的檔案文件的單機儲存。而XML則常用于超文本和超媒體的網絡信息的表現,且XML格式通過程序接口可以在大型檔案管理系統中的直接應用,目前常見到的網絡RSS數據聚合技術就是XML技術應用的一種表現。
二、圖形圖像格式文件的管理方法
相比較文本文件,圖形圖像在計算機中的實現方式要復雜得多,而且分類也很多,大體上可以把計算機中顯示的圖片格式文件分為位圖(圖像文件)和矢量圖(圖形文件)兩大類。
1.位圖的管理
位圖又稱之為點陣圖,它是按位映射圖像,它用像素點的亮度和顏色的數位集合來描述。在計算機內存中,由內存位(bit)組成。位圖的質量與像素點的粗細程度直接有關。它本身就是記載的每一個像素的位置和色彩的值(顏色通常用六位十六進制數來表示),位圖的生成主要靠掃描儀或數碼相機,往往占據大量存儲空間。Windows下位圖通常采用BMP格式儲存。
管理者在管理位圖文件的時候會遇到位圖格式文件體積過大備份不方便的困難,其實對于有些非技術性圖片采用JPG格式來儲存就會很方便。JPG格式就是對于BMP格式文件的一種壓縮格式,它采用的是被稱之為JPEG的靜態壓縮技術,這種技術針對圖像數據的很大冗余和人的視覺對邊緣變化不敏感的特點開發而成。JPG格式也是《電子文件歸檔與管理規范》(GB/T 18894-2002)規定的通用圖像文件格式,通常以JPG為擴展名。管理者在管理JPG圖片時要注意JPEG壓縮圖片的壓縮比率文件,其比率通常按百分比來計算,壓縮比越大圖像文件體積越小,圖像質量越模糊,反之則文件容量大,質量高。很多圖片瀏覽軟件都有轉換壓縮格式的功能,管理者可以通過Windows自帶的Windows圖片和傳真查看器軟件或ACDsee等應用工具軟件瀏覽和管理BMP和JPG格式的位圖文件。在轉換的時候可以先用軟件打開BMP文件然后選擇另存功能把BMP圖片另存為JPG格式圖片就完成了轉換過程,在轉換的時候管理者也可以通過設置來調節圖片的壓縮比率。
《電子文件歸檔與管理規范》(GB/T 18894-2002)中規定的另外一種通用的電子文件用圖像格式是TIFF格式。TIFF (Tagged Information File Format) 是一種不失真的 24-bit 彩色圖像格式,是設計用在跨平臺的使用上,所以為大多數的系統和圖像編輯軟件所接受。唯一的缺點就是 TIFF 本身有一些連自己都互不相容的版本,所以不同的圖像編輯軟件之間也許無法讀取對方的 TIFF 文件。但這個文件格式在新版的圖片工具軟件如 Photoshop 和 CorelDraw 中已經得到了解決。同樣,TIFF格式的圖片文件也可以通過上述圖片工具軟件來管理。
2.矢量圖形的管理
矢量格式的圖形文件使用曲線和角點來記錄文件信息,采用了這種方式的圖形無論被放大多少倍都能夠保持圖形非常清晰,但是它不能用來表達像素復雜的圖像。矢量圖形的特點是色塊鮮明,線條清晰,常用的矢量圖形格式有AI、FH9、SWF等。由于和位圖相比矢量圖體積很小,因此他很適用于網絡的傳播,目前很流行的FLASH動畫就是采用矢量格式的圖形。
在電子文件管理應用上矢量圖形通常用來管理科技檔案的圖形、圖表及模型圖、建筑圖、設計圖等,多見于計算機輔助設計的專業領域。
三、視頻格式文件的管理方法
視頻格式文件由圖像格式文件發展而來,將連續的位圖接連顯示就成了動態的視頻文件。因此未經過動態壓縮技術處理的視頻文件往往體積巨大。例如在VGA顯示中,存儲分辨率為640×480有256種色彩的一幀圖像,需要307200字節,若要達到每秒30幀的動態顯示,每秒需存儲量為9.2兆字節。600兆字節的光盤也只夠存放65秒的圖像數據。因此,同靜態圖像壓縮技術一樣,動態視頻的壓縮技術應用也很廣泛,目前比較流行的視頻壓縮技術就是MPEG(動態壓縮)技術。
針對全屏未壓縮AVI的視頻文件的巨大,動態壓縮比較成功地解決了這個問題,標準的MPEG1格式的視頻文件也就是現在通用的VCD影碟格式,采用352×240分辨率,可以在電視機上顯現出比較清晰的效果,基本上一個半小時的電影兩張CD-ROM光盤不到就可以裝下了。而時下最流行的DVD則是采用了國際通用的活動圖像壓縮標準MPEG-2(ISO/IEC13818)格式,MPEG2格式雖然比MPEG1格式的體積大很多,但對于視頻圖像畫質的表現卻比前者高很多倍。NTSC制式的MPG2格式為720像素/行×576行/幀,30幀/秒;PAL制式為720像素/行×488行/幀,25幀/秒,達到廣播級電視圖像質量。而單面單層DVD記錄層具有4.7GB容量,若以接近于廣播級電視圖像質量需要的平均數據率4.69Mbps播放,是能夠存放133分20秒的整部電影的。
管理者在管理視頻檔案文件的時候可以直接保管壓制好的DVD-Video光盤,若是通過采集器或攝像機等工具收集的視頻信息,可以通過專用的視頻工具軟件處理并保存為MPG格式的電子文件,這樣就可以通過刻錄機刻錄到VCD或DVD光盤上面了。在管理視頻文件的過程中要注意雖然MPEG的擴展名為MPG,但該類文件多見于MPEG1的格式文件,而MPEG2格式的視頻文件擴展名常見于TS,在DVD-Video光盤上的保存格式卻是VOD,MPG、TS和VOD格式文件都可以用視頻軟件來播放。
還有一些比較流行的視頻文件格式也可以作為管理視頻文件的格式標準來參考使用,如MPEG4格式。MPEG4誕生在1998年11月,它是一個國際標準;1999年,Microsoft開發了用于Windows Media的MPEG4─Codec;2000年2月,27歲的法國電影愛好者和德國的網絡駭客共同開發了一種基于MPEG4的視頻編/解碼平臺,同時網上也開放了免費下載。這就是DivX技術。這項技術所使用的MPEG4編碼壓縮技術是一種破壞性/高壓縮比的視頻壓縮技術,分Low Motion/Fast Motion兩種編碼核心,采用這種技術來壓縮一部4.7GB的DVD影片,同時保持相同的分辨率和AC3音軌只需要一張CD片即可。而且,MPEG4還支持流式輸出,因此可以通過網絡實時觀賞MPEG4的視頻剪輯。常用的視頻壓縮還有目前最為流行的網絡視頻音頻壓縮格式RM/RMVB格式,這是由RealNetworks公司推出的高壓縮比網絡視頻技術,采用其自身的Realplayer播放器來播放;而作為蘋果機常用的QuickTime格式視頻通常以MOV為擴展名存儲,同樣也是網絡視頻經常采用的格式;近年來微軟公司推出的WMA壓縮技術憑借其高超的視頻音頻質量和很小的容量也越來越流行。
這些視頻文件都可以通過Windows自帶的媒體播放器等軟件來打開觀賞,當然有一些視頻格式的文件必須安裝自己獨特的編碼解碼程序來播放,如前面提到的RM/RMVB格式和MOV格式的文件就必須先安裝相應的解碼程序才可以在任意的播放器中播放,當然也可以安裝某種格式的專用播放器進行播放。
四、音頻格式文件的管理方法
雖然早期的個人電腦多是采用PC喇叭發出單調的嘟嘟聲表達聲音,但聲卡技術的發展很快把個人電腦推向多媒體時代。
現在管理者管理的音頻文件通常是以Wave形式保存的,而且應用非常廣泛,Wave文件其實就是波形文件,它使用三個參數來表示聲音,它們是:采樣位數、采樣頻率和聲道數。在計算機中采樣位數一般有8位和16位之分,而采樣頻率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三種。Wave文件所占容量的公式就是:存儲量=(采樣頻率×采樣位數×聲道)×時間/8(單位:字節數)。因此,利用這些參數,計算機通過紀錄聲波波形的軌跡,將這些模擬波形轉換成數字信息就可以真實的模擬出大自然中的各種聲音。
管理者管理的音頻文件可以根據需要保存不同的聲音品質,日常生活中電話、收音機等均為模擬音頻信號,即不存在采樣頻率和采樣位數的概念,可以這樣比較一下:44KHz,16Bit的聲音稱作CD音質;22KHz、16Bit的聲音效果近似于立體聲(FM Stereo)廣播,稱作廣播音質;11kHz、8Bit的聲音稱作電話音質。在實際工作中,這些音頻文件都保存為擴展名為WAV的音頻文件。最簡單的音頻處理軟件就是Windows自帶的錄音機軟件,通過這個軟件,管理者可以對音頻文件進行簡單的編輯,如音量的放大和縮小、音頻文件回放速度快慢的調節、音頻回放的方向、音頻的質量等。對于語音類的音頻檔案通常可以轉換為單聲道低采樣頻率和低采樣位數來保存,因為語音在被壓縮之后不會有太大的變化,人的聲音仍然可以聽得清楚,但音頻文件的體積卻被大大的縮小了,處理速度也變快了,這樣就便于管理者管理。還有一些比較專業的音頻處理軟件,多用于專業領域,如Sound Forge和Gold Wave等。
《電子文件歸檔與管理規范》(GB/T 18894-2002)中除了規定WAV格式電子文件為通用的音頻格式外還規定了現在常用的音頻格式MP3格式。MP3(MPEG Audio Layer 3)是一種以高保真為前提下實現的高效壓縮技術。它采用了特殊的數據壓縮算法對原先的音頻信號進行處理,使數碼音頻文件的大小僅為原來的十幾分之一,而音樂的質量卻沒有什么變化,幾乎接近于CD唱盤的質量。一分鐘的滿采樣率WAVE格式的文件有10幾MB,而一分鐘MP3格式的音頻文件僅有1MB左右。MP3技術使在較小的存儲空間內,存儲大量的音頻數據成為可能。拿我們常用的標準CD-ROM來說:一張CD唱盤存儲的音樂與一盒卡帶差不多,若用MP3格式來存儲,則可存幾百首。
除此之外,真正被稱作計算機數字音樂的音頻文件格式則是MIDI格式,MIDI文件并非像WAV或MP3那樣量化的記錄樂曲每一時刻的聲音變化,它記錄的是如“音樂在什么時刻,使用什么樂器,以什么音符開始,以什么音調結束,加以什么伴奏”等等這樣的信息,所以MIDI文件本身并不是音樂,而是發音命令,MIDI文件本身只是一些數字信號而已,不包含任何聲音信息。相比較于WAVE文件,只是簡單描述性的MIDI文件占用的體積顯然要比波形信息小得多。一首可以播放5分鐘左右時間的MIDI歌曲,其容量只有百余K字節,這樣的小容量決定了它必定是網絡上和手機里最合適的數字音樂格式。MIDI的播放效果取決于用戶MIDI設備的質量和音色。就電腦聲卡而言,最為常見的手段是FM合成與波表合成。前者多用于以前的ISA聲卡,FM是“頻率調變”的英文縮寫,它運用聲音振蕩的原理對MIDI進行合成處理。但由于技術本身的局限,加上這類聲卡采用的大多數為廉價的芯片,效果自然不好。而波表合成所帶來的效果要遠遠超過FM,而且在電腦上已被廣泛運用,各類波表聲卡、波表軟件層出不窮。在實際使用中,MIDI文件通常以MID和RMI為擴展名,通過Windows自帶的媒體播放器就可以正常播放和管理。
電子文件的格式和類型多種多樣,管理方法又不盡相同,這就要求檔案工作者在實際應用中多積累經驗,多去接觸不同種類和格式的文件,并掌握各種不同的軟件去使用和管理這些文件和檔案,清楚各種格式電子文件和電子檔案的存儲方法和用途,這樣才能妥善保管和在實踐工作中具體應用好不同格式的電子文件和電子檔案。
摘自王志宇《不同格式電子文件的管理方法》
不同種類的電子文件不僅在系統中的存儲結構復雜,各種類型的電子文件格式在功能實現上也極其不同,可以說是種類不同,創建者在制作過程中的思維方式也是完全不同的,而對于使用者來說需要用完全不同的方式來管理和利用。
一、文本格式文件的管理方法
計算機中儲存文字文件的格式屬于文本格式類型電子文件,通常采用TXT格式來管理文本文件。計算機以二進制方式工作,它的全部字符也是用二進制來表示,那么就可以稱這些二進制數是字符的編碼。在計算機上常用的一種編碼是ASCII碼(American Standard Code for Information Interchange),稱作美國信息交換標準碼。而漢字在計算機中是以點陣形式存儲的,通常有16×16,24×24,48×48點陣等。供屏幕顯示用的漢字是16×16點陣,打印用漢字一般是24×24點陣。一個16×16點陣的漢字在計算機中是用256個點來表示,這256個點按橫16個點、豎16個點排列成一個正方形域,每個點用二進制數0或1表示,其中有筆劃經過的點為1,無筆劃經過的點為0。這樣一個16×16點陣漢字存儲在計算機中占用32個字節(每行16位二進制數,占兩個字節,共16行)。人們把常用漢字和符號以這種方式存儲在計算機的存儲器中就形成漢字字庫。
在Windows下的漢字字庫其實就是顯示文字的字體集合,每一種字體獨立而成一個字庫文件,計算機顯示漢字就是從使用者選定的字體的字庫文件中通過一一對應的關系映射到屏幕的文字。而存儲這些文字和符號的文件就被稱為文本文件,僅儲存文本信息的文件就被稱之為純文本文件,就是通常使用的TXT文件。
純文本文件的擴展名就是TXT,使用者在Windows下可以用記事本打開查看和編輯(DOS下用edit命令的文本編輯器)TXT格式的文件。常用的Word、WPS等辦公軟件雖然也可以查看和編輯文本文件,但這些強大的字處理軟件往往同時保存著許多文字的格式信息以及各種圖片、聲音、視頻剪輯、圖表等,因此它們生成的電子文件無法稱之為純文本文件。因此,如果要保存純文本文件不建議采用辦公處理軟件儲存文本文件。純文本的TXT文件除了用記事本等純文本編輯器管理外,它還可以通過相關的程序與辦公系統或檔案管理系統等軟件關聯,通過程序語言可以簡單的把文本符號從TXT文件中讀取出來供管理者在系統中利用和處理。TXT純文本文件有著自己獨特的優勢,它是體積最小、計算機處理速度最快的一種信息儲存格式,甚至某些大型管理系統直接面對TXT文件處理數據信息。檔案工作者在實際工作中可以直接把檔案的文字信息錄入記事本軟件中編輯處理,這樣無論今后辦公自動化軟件和計算機硬件技術如何升級換代,管理者采用的TXT文本文件永遠不會不兼容。
很多檔案文件需要更復雜的文字表現格式,如紅頭文件的頁面就無法用TXT格式來表現,有些檔案文件最好不通過任何系統處理就與配圖和配樂等多媒體文件相關聯,這樣就要用到其它格式的文本來儲存。根據《電子文件歸檔與管理規范》(GB/T 18894-2002)規定的文本文件通用格式,除了TXT格式之外,還有XML和RTF格式。后兩者的出現就是為了解決文本格式的編輯及文本與其他媒體格式文件關聯的問題,這兩種格式的文本文件通常都是通過超文本的標簽語句儲存標識出文本內部的不同信息,真正做到文字的元數據與純文本相分離并協調工作。具體來說,就是XML文件包括標簽在內的所有信息都是純文本格式的,但就是因為XML可以用純文本的標簽標識純文本信息,使這些被標識的數據與它們自身的數據相分離,做到同樣的數據通過不同的元數據輔助在解析器中可以生成不同效果的整體文件。雖然最終解析器表現出來的是多媒體甚至超媒體信息,但實際上該信息中的文本與元數據都是獨立存在的,而且它們都是純文本的,這就是XML真正優越的地方。檔案工作者同樣可以使用記事本來編輯XML文件,但因為標簽隊列的復雜性,通常可以采用XML專用的文本編輯器來編輯,如XML Explorer等軟件。RTF格式文件本身就是靜止的XML文件,但RTF通常用于保存單獨儲存的文本文件,這種情況常見于對WORD格式文件的轉化以及獨立內容的檔案文件的單機儲存。而XML則常用于超文本和超媒體的網絡信息的表現,且XML格式通過程序接口可以在大型檔案管理系統中的直接應用,目前常見到的網絡RSS數據聚合技術就是XML技術應用的一種表現。
二、圖形圖像格式文件的管理方法
相比較文本文件,圖形圖像在計算機中的實現方式要復雜得多,而且分類也很多,大體上可以把計算機中顯示的圖片格式文件分為位圖(圖像文件)和矢量圖(圖形文件)兩大類。
1.位圖的管理
位圖又稱之為點陣圖,它是按位映射圖像,它用像素點的亮度和顏色的數位集合來描述。在計算機內存中,由內存位(bit)組成。位圖的質量與像素點的粗細程度直接有關。它本身就是記載的每一個像素的位置和色彩的值(顏色通常用六位十六進制數來表示),位圖的生成主要靠掃描儀或數碼相機,往往占據大量存儲空間。Windows下位圖通常采用BMP格式儲存。
管理者在管理位圖文件的時候會遇到位圖格式文件體積過大備份不方便的困難,其實對于有些非技術性圖片采用JPG格式來儲存就會很方便。JPG格式就是對于BMP格式文件的一種壓縮格式,它采用的是被稱之為JPEG的靜態壓縮技術,這種技術針對圖像數據的很大冗余和人的視覺對邊緣變化不敏感的特點開發而成。JPG格式也是《電子文件歸檔與管理規范》(GB/T 18894-2002)規定的通用圖像文件格式,通常以JPG為擴展名。管理者在管理JPG圖片時要注意JPEG壓縮圖片的壓縮比率文件,其比率通常按百分比來計算,壓縮比越大圖像文件體積越小,圖像質量越模糊,反之則文件容量大,質量高。很多圖片瀏覽軟件都有轉換壓縮格式的功能,管理者可以通過Windows自帶的Windows圖片和傳真查看器軟件或ACDsee等應用工具軟件瀏覽和管理BMP和JPG格式的位圖文件。在轉換的時候可以先用軟件打開BMP文件然后選擇另存功能把BMP圖片另存為JPG格式圖片就完成了轉換過程,在轉換的時候管理者也可以通過設置來調節圖片的壓縮比率。
《電子文件歸檔與管理規范》(GB/T 18894-2002)中規定的另外一種通用的電子文件用圖像格式是TIFF格式。TIFF (Tagged Information File Format) 是一種不失真的 24-bit 彩色圖像格式,是設計用在跨平臺的使用上,所以為大多數的系統和圖像編輯軟件所接受。唯一的缺點就是 TIFF 本身有一些連自己都互不相容的版本,所以不同的圖像編輯軟件之間也許無法讀取對方的 TIFF 文件。但這個文件格式在新版的圖片工具軟件如 Photoshop 和 CorelDraw 中已經得到了解決。同樣,TIFF格式的圖片文件也可以通過上述圖片工具軟件來管理。
2.矢量圖形的管理
矢量格式的圖形文件使用曲線和角點來記錄文件信息,采用了這種方式的圖形無論被放大多少倍都能夠保持圖形非常清晰,但是它不能用來表達像素復雜的圖像。矢量圖形的特點是色塊鮮明,線條清晰,常用的矢量圖形格式有AI、FH9、SWF等。由于和位圖相比矢量圖體積很小,因此他很適用于網絡的傳播,目前很流行的FLASH動畫就是采用矢量格式的圖形。
在電子文件管理應用上矢量圖形通常用來管理科技檔案的圖形、圖表及模型圖、建筑圖、設計圖等,多見于計算機輔助設計的專業領域。
三、視頻格式文件的管理方法
視頻格式文件由圖像格式文件發展而來,將連續的位圖接連顯示就成了動態的視頻文件。因此未經過動態壓縮技術處理的視頻文件往往體積巨大。例如在VGA顯示中,存儲分辨率為640×480有256種色彩的一幀圖像,需要307200字節,若要達到每秒30幀的動態顯示,每秒需存儲量為9.2兆字節。600兆字節的光盤也只夠存放65秒的圖像數據。因此,同靜態圖像壓縮技術一樣,動態視頻的壓縮技術應用也很廣泛,目前比較流行的視頻壓縮技術就是MPEG(動態壓縮)技術。
針對全屏未壓縮AVI的視頻文件的巨大,動態壓縮比較成功地解決了這個問題,標準的MPEG1格式的視頻文件也就是現在通用的VCD影碟格式,采用352×240分辨率,可以在電視機上顯現出比較清晰的效果,基本上一個半小時的電影兩張CD-ROM光盤不到就可以裝下了。而時下最流行的DVD則是采用了國際通用的活動圖像壓縮標準MPEG-2(ISO/IEC13818)格式,MPEG2格式雖然比MPEG1格式的體積大很多,但對于視頻圖像畫質的表現卻比前者高很多倍。NTSC制式的MPG2格式為720像素/行×576行/幀,30幀/秒;PAL制式為720像素/行×488行/幀,25幀/秒,達到廣播級電視圖像質量。而單面單層DVD記錄層具有4.7GB容量,若以接近于廣播級電視圖像質量需要的平均數據率4.69Mbps播放,是能夠存放133分20秒的整部電影的。
管理者在管理視頻檔案文件的時候可以直接保管壓制好的DVD-Video光盤,若是通過采集器或攝像機等工具收集的視頻信息,可以通過專用的視頻工具軟件處理并保存為MPG格式的電子文件,這樣就可以通過刻錄機刻錄到VCD或DVD光盤上面了。在管理視頻文件的過程中要注意雖然MPEG的擴展名為MPG,但該類文件多見于MPEG1的格式文件,而MPEG2格式的視頻文件擴展名常見于TS,在DVD-Video光盤上的保存格式卻是VOD,MPG、TS和VOD格式文件都可以用視頻軟件來播放。
還有一些比較流行的視頻文件格式也可以作為管理視頻文件的格式標準來參考使用,如MPEG4格式。MPEG4誕生在1998年11月,它是一個國際標準;1999年,Microsoft開發了用于Windows Media的MPEG4─Codec;2000年2月,27歲的法國電影愛好者和德國的網絡駭客共同開發了一種基于MPEG4的視頻編/解碼平臺,同時網上也開放了免費下載。這就是DivX技術。這項技術所使用的MPEG4編碼壓縮技術是一種破壞性/高壓縮比的視頻壓縮技術,分Low Motion/Fast Motion兩種編碼核心,采用這種技術來壓縮一部4.7GB的DVD影片,同時保持相同的分辨率和AC3音軌只需要一張CD片即可。而且,MPEG4還支持流式輸出,因此可以通過網絡實時觀賞MPEG4的視頻剪輯。常用的視頻壓縮還有目前最為流行的網絡視頻音頻壓縮格式RM/RMVB格式,這是由RealNetworks公司推出的高壓縮比網絡視頻技術,采用其自身的Realplayer播放器來播放;而作為蘋果機常用的QuickTime格式視頻通常以MOV為擴展名存儲,同樣也是網絡視頻經常采用的格式;近年來微軟公司推出的WMA壓縮技術憑借其高超的視頻音頻質量和很小的容量也越來越流行。
這些視頻文件都可以通過Windows自帶的媒體播放器等軟件來打開觀賞,當然有一些視頻格式的文件必須安裝自己獨特的編碼解碼程序來播放,如前面提到的RM/RMVB格式和MOV格式的文件就必須先安裝相應的解碼程序才可以在任意的播放器中播放,當然也可以安裝某種格式的專用播放器進行播放。
四、音頻格式文件的管理方法
雖然早期的個人電腦多是采用PC喇叭發出單調的嘟嘟聲表達聲音,但聲卡技術的發展很快把個人電腦推向多媒體時代。
現在管理者管理的音頻文件通常是以Wave形式保存的,而且應用非常廣泛,Wave文件其實就是波形文件,它使用三個參數來表示聲音,它們是:采樣位數、采樣頻率和聲道數。在計算機中采樣位數一般有8位和16位之分,而采樣頻率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三種。Wave文件所占容量的公式就是:存儲量=(采樣頻率×采樣位數×聲道)×時間/8(單位:字節數)。因此,利用這些參數,計算機通過紀錄聲波波形的軌跡,將這些模擬波形轉換成數字信息就可以真實的模擬出大自然中的各種聲音。
管理者管理的音頻文件可以根據需要保存不同的聲音品質,日常生活中電話、收音機等均為模擬音頻信號,即不存在采樣頻率和采樣位數的概念,可以這樣比較一下:44KHz,16Bit的聲音稱作CD音質;22KHz、16Bit的聲音效果近似于立體聲(FM Stereo)廣播,稱作廣播音質;11kHz、8Bit的聲音稱作電話音質。在實際工作中,這些音頻文件都保存為擴展名為WAV的音頻文件。最簡單的音頻處理軟件就是Windows自帶的錄音機軟件,通過這個軟件,管理者可以對音頻文件進行簡單的編輯,如音量的放大和縮小、音頻文件回放速度快慢的調節、音頻回放的方向、音頻的質量等。對于語音類的音頻檔案通常可以轉換為單聲道低采樣頻率和低采樣位數來保存,因為語音在被壓縮之后不會有太大的變化,人的聲音仍然可以聽得清楚,但音頻文件的體積卻被大大的縮小了,處理速度也變快了,這樣就便于管理者管理。還有一些比較專業的音頻處理軟件,多用于專業領域,如Sound Forge和Gold Wave等。
《電子文件歸檔與管理規范》(GB/T 18894-2002)中除了規定WAV格式電子文件為通用的音頻格式外還規定了現在常用的音頻格式MP3格式。MP3(MPEG Audio Layer 3)是一種以高保真為前提下實現的高效壓縮技術。它采用了特殊的數據壓縮算法對原先的音頻信號進行處理,使數碼音頻文件的大小僅為原來的十幾分之一,而音樂的質量卻沒有什么變化,幾乎接近于CD唱盤的質量。一分鐘的滿采樣率WAVE格式的文件有10幾MB,而一分鐘MP3格式的音頻文件僅有1MB左右。MP3技術使在較小的存儲空間內,存儲大量的音頻數據成為可能。拿我們常用的標準CD-ROM來說:一張CD唱盤存儲的音樂與一盒卡帶差不多,若用MP3格式來存儲,則可存幾百首。
除此之外,真正被稱作計算機數字音樂的音頻文件格式則是MIDI格式,MIDI文件并非像WAV或MP3那樣量化的記錄樂曲每一時刻的聲音變化,它記錄的是如“音樂在什么時刻,使用什么樂器,以什么音符開始,以什么音調結束,加以什么伴奏”等等這樣的信息,所以MIDI文件本身并不是音樂,而是發音命令,MIDI文件本身只是一些數字信號而已,不包含任何聲音信息。相比較于WAVE文件,只是簡單描述性的MIDI文件占用的體積顯然要比波形信息小得多。一首可以播放5分鐘左右時間的MIDI歌曲,其容量只有百余K字節,這樣的小容量決定了它必定是網絡上和手機里最合適的數字音樂格式。MIDI的播放效果取決于用戶MIDI設備的質量和音色。就電腦聲卡而言,最為常見的手段是FM合成與波表合成。前者多用于以前的ISA聲卡,FM是“頻率調變”的英文縮寫,它運用聲音振蕩的原理對MIDI進行合成處理。但由于技術本身的局限,加上這類聲卡采用的大多數為廉價的芯片,效果自然不好。而波表合成所帶來的效果要遠遠超過FM,而且在電腦上已被廣泛運用,各類波表聲卡、波表軟件層出不窮。在實際使用中,MIDI文件通常以MID和RMI為擴展名,通過Windows自帶的媒體播放器就可以正常播放和管理。
電子文件的格式和類型多種多樣,管理方法又不盡相同,這就要求檔案工作者在實際應用中多積累經驗,多去接觸不同種類和格式的文件,并掌握各種不同的軟件去使用和管理這些文件和檔案,清楚各種格式電子文件和電子檔案的存儲方法和用途,這樣才能妥善保管和在實踐工作中具體應用好不同格式的電子文件和電子檔案。
摘自王志宇《不同格式電子文件的管理方法》