• Tidak ada hasil yang ditemukan

X¢Y DùNG QUY TR×NH Sè HO¸ T¦ LIÖU T¹I TH¦ VIÖN KHOA HäC X· HéI

N/A
N/A
Nguyễn Gia Hào

Academic year: 2023

Membagikan "X¢Y DùNG QUY TR×NH Sè HO¸ T¦ LIÖU T¹I TH¦ VIÖN KHOA HäC X· HéI "

Copied!
7
0
0

Teks penuh

(1)

X¢Y DùNG QUY TR×NH Sè HO¸ T¦ LIÖU T¹I TH¦ VIÖN KHOA HäC X· HéI

Phïng ThÞ B×nh(*)

1. Cïng víi sù ph¸t triÓn vµ øng dông réng r·i cña c«ng nghÖ th«ng tin vµ truyÒn th«ng, th− viÖn kü thuËt sè

®ang ph¸t triÓn m¹nh mÏ vµ lµ môc tiªu cña hÇu hÕt c¸c th− viÖn trªn thÕ giíi.

§©y lµ xu h−íng tÊt yÕu trong thêi ®¹i ngµy nay khi mµ nhu cÇu vµ mong muèn cña ng−êi dïng tin ngµy cµng cÇn nhanh vµ chÝnh x¸c ë møc ®é cao h¬n;

c¸c vÊn ®Ò b¶o qu¶n, l−u tr÷ gÆp nhiÒu khã kh¨n ®ßi hái ph¶i øng dông khoa häc c«ng nghÖ; viÖc t×m kiÕm trong th−

viÖn truyÒn thèng cã nhiÒu bÊt cËp, mÊt nhiÒu thêi gian cÇn ®Õn sù hç trî cña m¸y mãc hiÖn ®¹i; vµ ¸p lùc tõ dÞch vô th«ng tin bªn ngoµi m«i tr−êng th− viÖn

®ang gia t¨ng. Th− viÖn kü thuËt sè ra

®êi nh− lµ gi¶i ph¸p tèi −u gi¶i quyÕt c¸c vÊn ®Ò khã kh¨n ®ã. Mét mÆt, nã

®−îc xem nh− lµ mét trung t©m thu thËp vµ s¶n sinh ra nhiÒu tµi nguyªn th«ng tin kh¸c nhau, mÆt kh¸c lµ n¬i t×m kiÕm vµ truy xuÊt th«ng tin, cung cÊp nh÷ng dÞch vô th«ng tin chuyªn biÖt ë møc ®é cao, kh«ng giíi h¹n thêi gian vµ kh«ng gian. H¬n n÷a, víi kh¶ n¨ng l−u tr÷ khèi l−îng lín tµi nguyªn th«ng tin, chuyÓn giao tµi nguyªn ®ã b»ng nhiÒu ph−¬ng tiÖn kh¸c nhau,… th−

viÖn kü thuËt sè cÇn ®−îc trang bÞ hÖ thèng thiÕt bÞ, m¸y mãc, phÇn mÒm hiÖn ®¹i, chuyªn nghiÖp, h¹ tÇng m¹ng tèt; tÝch hîp vµ tæ chøc cã hÖ thèng c¸c bé s−u tËp sè lµm nguån tµi nguyªn; ®µo t¹o c¸n bé th− viÖn vµ ng−êi dïng tin ®Ó thÝch øng víi m«i tr−êng lµm viÖc, phôc vô kü thuËt sè.(*)

Ngµy nay, nhiÒu quèc gia trªn thÕ giíi ®· vµ ®ang tõng b−íc thay ®æi ph−¬ng thøc phôc vô b¹n ®äc trong th−

viÖn, ®ã lµ ph¸t triÓn th− viÖn kü thuËt sè. Th− viÖn kü thuËt sè ®−îc ph¸t triÓn theo m¹ng l−íi t¹o thµnh hÖ thèng cã ph©n cÊp møc ®é qu¶n lý nh»m môc

®Ých chia sÎ nguån lùc th«ng tin, liªn th«ng th− viÖn. C¸c bé s−u tËp sè ®−îc tÝch hîp trªn m¹ng më ra kh¶ n¨ng tiÕp cËn dÔ dµng h¬n víi ng−êi dïng. §iÓn h×nh nh− hÖ thèng th«ng tin th− viÖn kü thuËt sè cña c¸c tr−êng ®¹i häc ë Trung Quèc (China Academic Digita Libraries

& Information System - CADLIS).

CADLIS ®−îc ChÝnh phñ Trung Quèc

®Çu t− vµ ho¹t ®éng d−íi sù qu¶n lý cña Bé Gi¸o dôc Trung Quèc. CADLIS mang

(*) ThS., ViÖn Th«ng tin Khoa häc x· héi.

(2)

sø mÖnh ®Èy m¹nh, duy tr× vµ c¶i tiÕn chia sÎ nguån lùc th− viÖn gi÷a c¸c th−

viÖn cña c¸c tr−êng ®¹i häc, c¸c c¬ quan th«ng tin vµ c¸c c¬ së ®µo t¹o cña Trung Quèc. CADLIS ®−îc nç lùc x©y dùng víi nhiÒu h¹ tÇng më vµ ph©n t¸n. Nguån tµi nguyªn bao gåm c¬ së d÷ liÖu (CSDL) t¹p chÝ ®iÖn tö, ®Ò c−¬ng luËn

¸n, s¸ch ®iÖn tö, bµi trÝch vµ CSDL th−

môc Quèc gia. C¸c dÞch vô cña CADLIS t¹i c¸c th− viÖn thµnh viªn lµ m« h×nh th− viÖn kü thuËt sè trong lÜnh vùc gi¸o dôc dùa trªn mua c¸c CSDL liªn kÕt, c¸c th− môc liªn hîp, cho m−în liªn th−

viÖn vµ chia sÎ tµi liÖu. Trong thêi gian 5 n¨m, b¾t ®Çu tõ n¨m 1996, CADLIS

®· thµnh lËp 3 cÊp qu¶n lý gåm 4 cæng quèc gia, 8 trung t©m th«ng tin khu vùc, 400 th− viÖn thµnh viªn. §ång thêi, CADLIS ®· thiÕt lËp m¹ng l−íi nguån lùc th«ng tin kÕt hîp víi nguån lùc tù x©y dùng mét c¸ch tèt nhÊt ®Ó t¹o c¬ së cho th− viÖn kü thuËt sè, ph©n bè tíi hµng ngh×n tr−êng ®¹i häc. Víi môc tiªu cung cÊp c¸c dÞch vô cho gi¸o dôc bËc cao, nghiªn cøu khoa häc, ®Æc biÖt phôc vô c¸c ngµnh träng ®iÓm, CADLIS ®·

chó träng ®Õn x©y dùng vµ øng dông kü thuËt tiªn tiÕn vµo th− viÖn kü thuËt sè t¹i Trung Quèc. §Õn cuèi n¨m 2005, nguån tµi nguyªn sè cña CADLIS bao gåm 30.000 tªn t¹p chÝ cña Trung Quèc vµ ph−¬ng T©y, 20 triÖu biÓu ghi bµi t¹p chÝ, 3 triÖu d÷ liÖu th− môc, 6 triÖu biÓu ghi tµi liÖu trong môc lôc liªn hîp trùc tuyÕn, 1 triÖu b¶n luËn v¨n toµn v¨n, 30.000 ®Çu s¸ch ®iÖn tö,… vµ ®· cã trªn 600 th− viÖn thµnh viªn [1].

ë ViÖt Nam, Th− viÖn Quèc gia ViÖt Nam lµ th− viÖn ®i ®Çu trong ph¸t triÓn th− viÖn kü thuËt sè, b−íc ®Çu b¹n ®äc

®· cã thÓ sö dông th− viÖn trªn m¹ng.

Cho ®Õn nay, Th− viÖn Quèc gia ®· t¹o

lËp ®−îc mét hÖ thèng c¸c bé s−u tËp sè bao gåm: S¸ch ®¬n: 324.651 tªn, S¸ch tËp: 83.404 cuèn, Bµi trÝch: 30.001 bµi, LuËn ¸n: 19.615 b¶n, S¸ch bé: 9.096 cuèn, T¹p chÝ: 6.401 cuèn, Nghiªn cøu:

1.746 cuèn, Media: 1.538 ®Üa, ¶nh:

1.417 ¶nh, B¶n ®å: 929 b¶n, B¸o: 778 sè,… [5]. Mét sè bé s−u tËp sè cã thÓ tra cøu trªn m¹ng, ®ã lµ: S¸ch §«ng D−¬ng (http://dl.nlv.gov.vn/sachdongduong), S¸ch H¸n N«m (http://nom.nlv.gov.vn),

LuËn ¸n TiÕn sÜ

(http://dl.nlv.gov.vn/luanan).

Gi¶i ph¸p x©y dùng th− viÖn kü thuËt sè t¹i Th− viÖn Quèc gia tuy vÉn

®ang trong qu¸ tr×nh x©y dùng vµ ph¸t triÓn nh−ng ®· phÇn nµo chøng tá ®−îc nh÷ng tiÖn Ých cña nã ®èi víi ng−êi dïng nh− cã thÓ ®äc tµi liÖu ë bÊt kú

®©u vµ khi nµo th«ng qua m¹ng Internet, kh«ng giíi h¹n vÒ thêi gian, tiÕt kiÖm kh«ng gian, më réng ®èi t−îng phôc vô b¹n ®äc, ®a truy cËp (cïng mét tµi liÖu, cïng mét thêi ®iÓm cã thÓ phôc vô ®−îc nhiÒu ng−êi), tiÕp cËn tµi liÖu theo cÊu tróc, t×m kiÕm th«ng tin nhanh vµ linh ho¹t, ®ãng vai trß quan träng trong b¶o qu¶n vµ b¶o tån tµi liÖu. HiÖn t¹i, nguån tµi liÖu sè hãa toµn v¨n cña Th− viÖn Quèc gia kh¸ lín vµ cßn cã kh¶

n¨ng tiÕp tôc gia t¨ng m¹nh mÏ trong thêi gian tíi víi nh÷ng dù ¸n sè hãa lín

®ang ®−îc triÓn khai, cïng víi sù liªn kÕt hîp t¸c víi c¸c nhµ xuÊt b¶n.

2. NÕu th− viÖn truyÒn thèng phôc vô ng−êi dïng tin dùa vµo vèn tµi liÖu truyÒn thèng, th× th− viÖn kü thuËt sè

®¸p øng nhu cÇu tin b»ng nguån tµi nguyªn sè th«ng qua giao diÖn Web. C¸c bé s−u tËp sè ®−îc tÝch hîp, qu¶n trÞ th«ng qua hÖ thèng phÇn mÒm th− viÖn hiÖn ®¹i vµ ®−îc x©y dùng theo c¸c c¸ch sau:

(3)

Thø nhÊt, tæ chøc sè hãa nguån tµi liÖu truyÒn thèng b»ng c¸c thiÕt bÞ sè hãa.

Thø hai, mua tµi liÖu ®iÖn tö tõ c¸c nhµ cung cÊp/xuÊt b¶n hay c¸c c¸ nh©n hoÆc th«ng qua trao ®æi.

Thø ba, truy cËp khai th¸c tõ viÖc liªn kÕt ®Õn c¸c nguån tµi nguyªn sè cã cïng chñ ®Ò, néi dung trªn Internet [3, 150].

Trong ®ã, c¸ch thø nhÊt ®ang ®−îc c¸c th− viÖn triÓn khai nhiÒu nhÊt, ®ång thêi còng lµ c¸ch x©y dùng ®−îc c¸c bé s−u tËp ®Çy ®ñ nhÊt. Bëi lÏ, mçi th−

viÖn ®Òu cã c¸c bé s−u tËp tµi liÖu thÓ hiÖn b¶n s¾c riªng, ®Æc thï riªng. Néi dung c¸c bé s−u tËp thÓ hiÖn nÐt ®Æc s¾c mang gi¸ trÞ lÞch sö, v¨n hãa, nh©n v¨n cña quèc gia (c¸c bé s−u tËp cæ, quý hiÕm, ®éc b¶n), mang gi¸ trÞ nghiªn cøu khoa häc cao cÇn ®−îc chia sÎ réng r·i.

MÆt kh¸c, phÇn lín t×nh tr¹ng vËt lý cña nh÷ng bé s−u tËp nµy ®ang ngµy mét xuèng cÊp, thËm chÝ cã nguy c¬

kh«ng thÓ phôc chÕ, do ®ã cÇn cã biÖn ph¸p kh¾c phôc.

Trong qu¸ tr×nh x©y dùng bé s−u tËp sè, c¸c th− viÖn ®Òu t×m kiÕm mét gi¶i ph¸p c«ng nghÖ phï hîp ®èi víi hiÖn tr¹ng tµi liÖu nh»m môc ®Ých ®¹t chÊt l−îng cao nhÊt. HiÖn nay, c¸c thiÕt bÞ sè hãa tµi liÖu ®−îc rÊt nhiÒu nhµ s¶n xuÊt nghiªn cøu vµ ®−a ra thÞ tr−êng, lùa chän gi¶i ph¸p nµo, thiÕt bÞ nµo phô thuéc vµo t×nh tr¹ng vËt lý tõng bé s−u tËp tµi liÖu gèc. V× vËy, bé phËn sè hãa t¹i c¸c th− viÖn nªn trang bÞ ®a d¹ng c¸c thiÕt bÞ sè hãa, tõ c¸c thiÕt bÞ sö dông thñ c«ng nh− m¸y ¶nh, m¸y scan theo c¸c khæ cì kh¸c nhau ®Õn c¸c thiÕt bÞ sè hãa tù ®éng nh− Scanrobot, Kitar, dßng m¸y Bookeye,… C¸c thiÕt bÞ sè hãa tù ®éng cã phÇn mÒm xö lý ®i kÌm nªn s¶n phÈm ®Çu ra lµ ®ång ®Òu vÒ

chÊt l−îng. §èi víi c¸c thiÕt bÞ sè hãa thñ c«ng, sau khi chôp ¶nh hoÆc scan tµi liÖu, th− viÖn cÇn lùa chän mét phÇn mÒm thÝch hîp ®Ó xö lý thµnh tµi liÖu sè.

HiÖn nay, nhiÒu th− viÖn ®· thµnh lËp bé phËn sè hãa tµi liÖu. C«ng viÖc sè hãa ®−îc tiÕn hµnh theo quy tr×nh cô thÓ. §Çu vµo cña quy tr×nh bao giê còng lµ tµi liÖu gèc, ®Çu ra lµ tµi liÖu sè vµ quy tr×nh nµy ¸p dông cho c¶ hÖ thèng sè hãa hiÖn ®¹i còng nh− thñ c«ng (H×nh 1).

§èi víi c¸c thiÕt bÞ sè hãa hiÖn ®¹i, tù ®éng, quy tr×nh gÇn nh− ®−îc thùc hiÖn khÐp kÝn tõ kh©u ®Çu vµo ®Õn kh©u ®Çu ra. ViÖc sè hãa theo ph−¬ng ph¸p thñ c«ng còng tu©n theo quy tr×nh h×nh 1 nh−ng cã thÓ t¸ch thµnh tõng c«ng ®o¹n

®Ó c¸n bé lµm viÖc theo chuyªn m«n hãa vµ mçi c¸n bé cã thÓ chØ

®¶m nhËn mét c«ng ®o¹n trong

quy tr×nh.

Ph−¬ng ph¸p chuyªn m«n hãa nµy cho kÕt qu¶ nhanh vµ chÊt l−îng kh«ng kÐm c¸c thiÕt bÞ sè hãa tù ®éng. Tuy nhiªn, vÊn ®Ò thùc hiÖn quy tr×nh sè hãa hiÖn nay kh«ng ph¶i lóc nµo còng ®Çy ®ñ c¸c b−íc nh−

s¬ ®å h×nh 1. §èi víi nhiÒu tµi liÖu sè hãa, c«ng ®o¹n “nhËn d¹ng/t¹o siªu d÷

H×nh 1: Quy tr×nh sè hãa c¬ b¶n

§Çu vµo Tµi liÖu gèc

QuÐt/chôp

Xö lý ¶nh

ChuyÓn d¹ng

NhËn d¹ng/

t¹o siªu d÷

liÖu

§Çu ra Tµi liÖu sè

(4)

liÖu” cho tµi liÖu kh«ng thùc hiÖn ®−îc v× c¸c tµi liÖu viÕt tay, c¸c tµi liÖu lµ ch÷

t−îng h×nh (ch÷ H¸n, N«m, NhËt, s¾c phong,…) ch−a cã phÇn mÒm hç trî nhËn d¹ng ®−îc do tÝnh phøc t¹p trong cÊu t¹o ch÷ viÕt. Do vËy, c¸c tµi liÖu nµy khi sè hãa chØ chuyÓn d¹ng ¶nh hoÆc tÖp PDF th«ng th−êng (chØ cã siªu d÷

liÖu cÊu tróc), c¸c d÷ liÖu t×m kiÕm lµ c¸c biªn môc cã s½n trong CSDL. §©y lµ vÊn ®Ò mµ nh÷ng ng−êi lµm c«ng t¸c sè hãa mong muèn t×m ra gi¶i ph¸p kh¾c phôc. HiÖn nay, c¸c tµi liÖu viÕt tay, c¸c tµi liÖu H¸n cæ, NhËt cæ, N«m, c¸c b¶n

®å, s¾c phong,… cã mét sè l−îng lín lµ tµi liÖu cæ, cã gi¸ trÞ vÒ mÆt v¨n hãa, lÞch sö cßn l¹i kh«ng nhiÒu (thËm chÝ chØ cã mét b¶n duy nhÊt) nªn c¸c th−

viÖn cÇn cã ph−¬ng ¸n b¶o vÖ, b¶o qu¶n, l−u gi÷ an toµn. Sau khi sè hãa cÇn ®Æc biÖt quan t©m ®Õn viÖc t¹o c¸c siªu d÷

liÖu cho tµi liÖu sè, c¸c th«ng tin nµy kh«ng chØ ®Ó t×m kiÕm mµ cßn kh¼ng

®Þnh b¶n quyÒn cña c¬ quan l−u tr÷ tµi liÖu, lµ tµi s¶n thuéc vÒ quèc gia. §©y lµ vÊn ®Ò mµ kh«ng ph¶i th− viÖn nµo còng gi¶i quyÕt ®−îc.

3. Th− viÖn Khoa häc x· héi (Th−

viÖn KHXH) ®−îc kÕ thõa mét khèi l−îng tµi liÖu lín tõ Häc viÖn ViÔn §«ng B¸c cæ Ph¸p (EFEO). §©y lµ nguån tµi liÖu rÊt quý, cã nh÷ng bé s−u tËp lµ ®éc b¶n t¹i ViÖt Nam. HiÖn Th− viÖn KHXH cã h¬n 160 tËp thÇn tÝch, thÇn s¾c cña kho¶ng 9.000 lµng ViÖt (víi kho¶ng 230.000 trang t− liÖu viÕt tay), 1.225 b¶n h−¬ng −íc ®−îc viÕt b»ng ch÷ H¸n, ch÷ N«m, b»ng bót l«ng trªn giÊy dã, trong ®ã cã kho¶ng 50 v¨n b¶n so¹n vµo thÕ kû XVIII-XIX. H¬n 5.000 b¶n h−¬ng

−íc b»ng ch÷ Quèc ng÷, viÕt tay. H¬n 3.000 b¶n kª b»ng ch÷ H¸n, ch÷ N«m c¸c d¹ng v¨n hãa lµng x· nh− thÇn s¾c,

v¨n bia, ®Þa b¹, kho¶n lÖ,… Vµ b¶n kª

®Þa danh lµng x· n¨m 1923 cña hÇu hÕt c¸c tØnh, thµnh trong c¶ n−íc. Trong kho b¶n ®å cßn l−u gi÷ kho¶ng 1.900 tªn b¶n ®å c¸c lo¹i, trong ®ã cã hµng ngµn b¶n ®å vÒ ViÖt Nam vµ §«ng D−¬ng. B¶n ®å Trung Quèc cã trªn 200 lo¹i, cã b¶n ®å ®−îc vÏ hoÆc in rÊt sím tõ 1584. Cã nhiÒu b¶n ®å ®−îc coi lµ quý nh− b¶n ®å vÒ Hµ Néi n¨m 1831, 1873, b¶n ®å Sµi Gßn 1902, c¸c b¶n ®å vÒ ®Þa giíi, l·nh h¶i,… T¹i Th− viÖn KHXH, c¸c häc gi¶ EFEO ®· s−u tÇm ®−îc h¬n 400 b¶n s¾c phong cña triÒu NguyÔn vµ c¸c triÒu ®¹i phong kiÕn thêi tr−íc, b¶n cæ nhÊt mµ Th− viÖn KHXH cã ®−îc lµ vµo thÕ kû XVI. Bªn c¹nh ®ã, Th− viÖn KHXH cßn l−u gi÷ kho ¶nh gåm kho¶ng 40.000 ¶nh vÒ ViÖt Nam vµ §«ng D−¬ng. Kho ¶nh nµy ®−îc h×nh thµnh chñ yÕu tõ c¸c c«ng tr×nh nghiªn cøu cña c¸c nhµ sö häc, kiÕn tróc s−, kh¶o cæ häc, d©n téc häc,… ng−êi Ph¸p vµ ng−êi ViÖt Nam. Mét phÇn kh¸c lµ ¶nh do c¸c c«ng chøc thuéc c¸c c¬ quan hµnh chÝnh thuéc ®Þa cung cÊp. Mét sè l−îng lín tµi liÖu lµ s¸ch vµ b¸o chÝ Ên b¶n víi gÇn 500.000 s¸ch, h¬n 2.000 lo¹i b¸o vµ t¹p chÝ tiÕng ViÖt vµ tiÕng n−íc ngoµi.

Bé s−u tËp s¸ch NhËt B¶n cæ cã 11.000 b¶n, Trung Quèc cæ cã 31.000 b¶n, s¸ch Latin cæ cã trªn 30.000 b¶n,… b¶n s¸ch cæ nhÊt cña th− viÖn cã niªn ®¹i tõ thÕ kû XIV [2, 7-9].

HiÖn nay, t¹i Th− viÖn KHXH, tµi liÖu ®−a vµo sè hãa ®−îc c©n nh¾c lùa chän tõ nh÷ng bé s−u tËp tµi liÖu cæ, cã gi¸ trÞ vÒ mÆt nghiªn cøu khoa häc, v¨n hãa, lÞch sö (chñ yÕu lµ nh÷ng bé s−u tËp do EFEO bµn giao l¹i). Nh÷ng tµi liÖu nµy chñ yÕu cã tuæi ®êi trªn 60 n¨m. Qua nhiÒu n¨m phôc vô ®éc gi¶ vµ chÞu sù t¸c ®éng cña c¸c yÕu tè tù nhiªn

(5)

nªn tµi liÖu ®ang bÞ xuèng cÊp nh− bÞ g·y, gißn thËm chÝ bÞ r¸ch n¸t (®èi víi tµi liÖu in), nhiÒu cuèn bÞ nhße ch÷, mÊt ch÷, bong g¸y, môc chØ (®èi víi tµi liÖu viÕt tay). Tr−íc thùc tÕ ®ã, nghiªn cøu mét quy tr×nh thùc hiÖn sè hãa ®¶m b¶o chÊt l−îng tµi liÖu sè, an toµn cho tµi liÖu gèc, h¹n chÕ ®Õn møc thÊp nhÊt sù t¸c ®éng trùc tiÕp ®Õn tµi liÖu lµ ph−¬ng

¸n kh¶ thi nhÊt. Bëi, khi chuyÓn thµnh d¹ng tµi liÖu sè th× cïng lóc cã thÓ phôc vô ®−îc nhiÒu ®éc gi¶, h¹n chÕ nh÷ng t¸c ®éng trùc tiÕp tíi tµi liÖu gèc vµ cã thÓ phôc chÕ, in l¹i trong tr−êng hîp cÇn thiÕt.

Tõ n¨m 2008, trong ch−¬ng tr×nh hîp t¸c gi÷a Th− viÖn Quèc gia Anh,

§¹i häc Temple (Mü) vµ Th− viÖn KHXH, dù ¸n nghiªn cøu ph−¬ng ph¸p sè hãa tµi liÖu cæ quý hiÕm ®−îc ®Ò xuÊt.

§Õn n¨m 2009, dù ¸n chÝnh thøc ®i vµo nghiªn cøu vµ thö nghiÖm trªn bé s−u tËp H¸n N«m. Nhãm sè hãa cña Th−

viÖn ®−îc thµnh lËp gåm 6 thµnh viªn, lµm viÖc cïng chuyªn gia ®Õn tõ §¹i häc Temple trong suèt 2 n¨m vµ còng gÆp rÊt nhiÒu khã kh¨n trong thêi gian ®Çu.

Tr−íc hÕt lµ nghiÖp vô cña c¸n bé, hÇu nh− ch−a tõng ®−îc ®µo t¹o vÒ nghiÖp vô sè hãa vµ ®i thùc tÕ ë nh÷ng ®¬n vÞ kh¸c. Thø hai, s¸ch ®−a vµo thö nghiÖm

®−îc in trªn giÊy dã rÊt cæ vµ xuèng cÊp nghiªm träng, nªn cÇn nghiªn cøu ph−¬ng ph¸p an toµn nhÊt cho tµi liÖu.

Thø ba, phÇn mÒm lùa chän ®Ó xö lý lµ Adobe Photoshop ®−îc lùa chän ®Ó xö lý tµi liÖu kh«ng cã kh¶ n¨ng xö lý ¶nh

®ång lo¹t (tiªu chÝ nhãm sè hãa ®Æt ra lµ c¸c trang trong mét cuèn s¸ch vÒ mÆt thÈm mü ph¶i cã kÝch th−íc b»ng nhau khi ®−îc tr×nh bµy trªn giao diÖn Web).

Thø t−, nhãm sè hãa ch−a t×m ra gi¶i ph¸p t¹o siªu d÷ liÖu cho tµi liÖu sè H¸n

N«m v× ch−a cã phÇn mÒm hç trî. Ngoµi ra, nhãm cßn gÆp nhiÒu khã kh¨n kh¸c.

Trong qu¸ tr×nh nghiªn cøu vµ thö nghiÖm, nhãm sè hãa cña Th− viÖn KHXH ®· tõng b−íc gi¶i quyÕt ®−îc c¸c vÊn ®Ò khã kh¨n gÆp ph¶i vµ tiÕn hµnh x©y dùng bé s−u tËp sè H¸n N«m nh− sau:

- VÒ chuÈn m« t¶ tµi liÖu sè, nhãm sè hãa lùa chän Dublin Core gåm 15 tr−êng m« t¶. §©y lµ chuÈn m« t¶ tµi liÖu sè ®−îc nhiÒu chuyªn gia ®¸nh gi¸

cao vÒ tÝnh linh ho¹t vµ tiÖn lîi cña nã.

HiÖn nay, Dublin Core ®−îc nhiÒu th−

viÖn trªn thÕ giíi lùa chän.

- ThiÕt bÞ sè hãa: lùa chän 2 m¸y

¶nh Sony alpha 350 ®Ó chôp ¶nh, sö dông bµn ch÷ V tù thiÕt kÕ ®Ó kª vµ kÑp s¸ch. Sö dông m¸y ¶nh sÏ gi¶m thiÓu nh÷ng t¸c ®éng trùc tiÕp lªn s¸ch, chÊt l−îng ¶nh cao, trung thùc nh− mµu s¸ch thùc. Sö dông bµn ch÷ V cã khe kÑp g¸y s¸ch ®Ó cè ®Þnh kh«ng ®Ó s¸ch dÞch chuyÓn. Kü thuËt chôp ¶nh ®¶m b¶o h×nh ¶nh ®¹t ®é trung thùc vÒ mµu s¾c vµ ®é nÐt cao nhÊt. Nhãm sè hãa h−íng ®Õn môc tiªu ¶nh sè lµ trang ¶nh gi÷ nguyªn tÝnh lÞch sö cña tµi liÖu gèc cã tÝnh chÊt b¶o tån.

- PhÇn mÒm xö lý ¶nh, nhãm sè hãa nghiªn cøu, t×m hiÓu vµ lùa chän Adobe Photoshop Lightroom. §©y lµ phÇn mÒm miÔn phÝ gióp nhãm sè hãa gi¶i quyÕt rÊt nhiÒu vÊn ®Ò khã kh¨n trong kü thuËt sè hãa:

+ Adobe Photoshop Lightroom cho phÐp cÈn c¸c siªu d÷ liÖu vµo trong tõng

¶nh, c¸c th«ng tin Metadata cho phÐp nhËp ®¶m b¶o kh¶ n¨ng t×m kiÕm th«ng tin ë c¸c tiªu chÝ nh− m· s¸ch, tªn s¸ch, chñ ®Ò, t×nh tr¹ng tµi liÖu, ng−êi thùc hiÖn, c¬ quan thùc hiÖn, c¸c th«ng tin

(6)

b¶n quyÒn, logo cña th− viÖn ch×m,…

C¸c th«ng tin cÈn vµo trong mçi ¶nh tuy chØ dõng l¹i ë møc ®é cña c¸c th«ng tin biªn môc nh−ng ®©y lµ ®iÒu v« cïng quan träng. Cã líp d÷ liÖu nµy c¸c files tµi liÖu d¹ng ¶nh ®· ®−îc chuyÓn thµnh c¸c files tµi liÖu sè, tµi liÖu xuÊt hiÖn ë bÊt kú ®©u (kh«ng kÌm tr−êng m« t¶), ng−êi ®äc còng cã thÓ biÕt ®−îc m· cña tµi liÖu, nhan ®Ò, chñ ®Ò, vÞ trÝ cña tµi liÖu thuéc vÒ th− viÖn nµo, quèc gia nµo.

HiÖn nay, trong khi c¸c phÇn mÒm nhËn d¹ng ch−a t¹o ®−îc c¸c siªu d÷ liÖu cho c¸c tµi liÖu viÕt tay, tµi liÖu lµ ch÷ t−îng h×nh th× sö dông chøc n¨ng Metadata cña Adobe Photoshop Lightroom lµ mét gi¶i ph¸p tèt. Tuy c¸c siªu d÷ liÖu t×m kiÕm kh«ng ®¹t ®−îc ®Õn møc cã thÓ t×m kiÕm ®Õn tõng ký tù trong v¨n b¶n nh− c¸c phÇn mÒm nhËn d¹ng nh−ng nã

®· phÇn nµo gi¶i quyÕt ®−îc nh÷ng khã kh¨n hiÖn nay cña c«ng t¸c sè hãa. §©y lµ thµnh c«ng quan träng mµ nhãm sè hãa cña Th− viÖn ®· lµm ®−îc.

+ Adobe Photoshop Lightroom cã kh¶ n¨ng xö lý ¶nh ®ång lo¹t. C¸c ¶nh sau khi xö lý cã cïng kÝch th−íc, cïng

®é ph©n gi¶i, mang l¹i hiÖu qu¶ thÈm mü cao.

+ Adobe Photoshop Lightroom cho phÐp ®Æt tªn c¸c trang ¶nh tuÇn tù nh−

®¸nh sè trang cho mét cuèn s¸ch.

Ngoµi ra, nhãm sè hãa cßn sö dông thªm c¸c phÇn mÒm tù lËp tr×nh nh−

webresize.php vµ webthumbs.php ®Ó gi¶m kÝch th−íc vµ dung l−îng ¶nh mµ vÉn gi÷ ®−îc c¸c th«ng tin Metadata cÈn trong mçi ¶nh.

- Bé s−u tËp H¸n N«m ®−îc tr×nh bµy trªn giao diÖn Web, c¸c trang s¸ch

®−îc tr×nh bµy theo ®óng tr×nh tù ®äc cña mét cuèn s¸ch H¸n cæ, N«m cæ

(http://vietcenter.temple.edu/issi/issi_lib .php). C¸c th«ng tin Dublin Core ®−îc kÕt nèi ®Õn tõng trang s¸ch vµ t¹i ®©y, ng−êi dïng cã thÓ xem danh môc toµn bé CSDL hoÆc theo bé s¸ch. C¸c chøc n¨ng t×m kiÕm theo nhan ®Ò, t¸c gi¶, chñ ®Ò, tõ khãa.

Qua qu¸ tr×nh x©y dùng bé s−u tËp H¸n N«m, nhãm sè hãa ®· hoµn thµnh CSDL sè H¸n N«m víi 2.056 cuèn, trong ®ã 245 cuèn sè hãa toµn v¨n cßn l¹i sè hãa 3 trang. Tæng sè trang tµi liÖu sè xÊp xØ 50.000 trang, biªn môc theo chuÈn Dublin Core 2.056 biÓu ghi. Trªn mçi biÓu ghi tr×nh bµy víi 3 ng«n ng÷:

tiÕng ViÖt, tiÕng Anh vµ ng«n ng÷ tµi liÖu sö dông (H¸n, N«m, NhËt). Trong qu¸ tr×nh biªn môc, mét sè khã kh¨n khi nhËp ch÷ H¸n vµ N«m (do nhiÒu ch÷ cæ ch−a cã trong bé font Unicode) ®·

®−îc c¸c chuyªn gia ng«n ng÷ nghiªn cøu N«m häc cña §¹i häc Temple (Mü) hç trî. HiÖn nay, b¹n ®äc cã thÓ tra cøu bé s−u tËp H¸n N«m t¹i ®Þa chØ:

http://vietcenter.temple.edu/issi/issi_lib.

php.

Giao diÖn web cña CSDL sè H¸n N«m

(7)

4. Ph¸t triÓn th− viÖn kü thuËt sè lµ vÊn ®Ò tÊt yÕu cña hÇu hÕt c¸c th− viÖn hiÖn nay. §Ó tr¸nh t×nh tr¹ng l¹c hËu, c¸c th− viÖn cÇn nhanh chãng chuÈn bÞ c¸c ®iÒu kiÖn cÇn thiÕt vÒ c¬ së vËt chÊt, kü thuËt, nguån tµi nguyªn th«ng tin sè, con ng−êi víi ®Çy ®ñ kiÕn thøc ®Ó cã thÓ ho¹t ®éng trong m«i tr−êng kü thuËt sè.

Sau qu¸ tr×nh nghiªn cøu vµ thö nghiÖm, chóng t«i cho r»ng c«ng t¸c sè hãa tµi liÖu trong mçi th− viÖn lµ rÊt quan träng. Mçi th− viÖn cÇn cã mét trung t©m sè hãa. Trung t©m nµy kh«ng chØ thùc hiÖn c«ng t¸c sè hãa mµ cßn cã tr¸ch nhiÖm l−u tr÷, b¶o qu¶n c¸c bé s−u tËp sè; nghiªn cøu c¸c vÊn ®Ò khoa häc trong ho¹t ®éng sè hãa. Bªn c¹nh

®ã, trung t©m sè hãa cßn cã nhiÖm vô häc hái thùc tiÔn c¸c ho¹t ®éng sè hãa cña c¸c trung t©m kh¸c (c¶ trong vµ ngoµi n−íc) ®Ó nhanh chãng øng dông c¸c gi¶i ph¸p míi vµo ho¹t ®éng cña trung t©m m×nh. C¸n bé ho¹t ®éng t¹i trung t©m sè hãa ph¶i lu«n lu«n cËp nhËt c¸c kiÕn thøc míi vÒ c«ng nghÖ th«ng tin ®Ó kh«ng bÞ l¹c hËu.

§èi víi tõng d¹ng tµi liÖu vµ chÊt l−îng tµi liÖu kh¸c nhau cÇn lùa chän ph−¬ng ph¸p sè hãa kh¸c nhau. Môc tiªu cuèi cïng cña ho¹t ®éng sè hãa bao giê còng lµ ®¹t ®Õn chÊt l−îng s¶n phÈm sè tèt nhÊt vµ ®¶m b¶o an toµn cho tµi liÖu gèc ë møc cao nhÊt. §èi víi

c¸c tµi liÖu cæ, cã gi¸ trÞ cÇn ®¶m b¶o an toµn kh«ng chØ vÒ t×nh tr¹ng vËt lý mµ cßn ®¶m b¶o chóng kh«ng bÞ mÊt khi

®−a ra sè hãa. Ph−¬ng ph¸p t¹o siªu d÷

liÖu b»ng chøc n¨ng cña phÇn mÒm Adobe Photoshop Lightroom lµ mét c¸ch b¶o vÖ tµi liÖu trong tr−êng hîp bÞ mÊt, v× c¸c siªu d÷ liÖu nµy chÝnh lµ chøng cø chøng minh tµi liÖu ®ã thuéc b¶n quyÒn cña th− viÖn

TµI LIÖU THAM KH¶O

1. Feng Ying (2005), Buiding China

Academic Digital,

http://iadlc.nul.nagoyau.ac.jp/archiv es.html

2. Hå SÜ Quý (2011), “VÒ mét Th− viÖn Khoa häc x· héi tÇm cì khu vùc”

trong Th− viÖn Khoa häc x· héi, Nxb. Khoa häc x· héi, Hµ Néi.

3. TrÇn ThÞ Quý (2011), “Sè hãa tµi liÖu” - tõ nhËn thøc ®Õn triÓn khai

®µo t¹o t¹i khoa Th«ng tin th− viÖn, tr−êng §¹i häc Khoa häc x· héi &

Nh©n v¨n”, Héi nghÞ - héi th¶o: X©y dùng vµ chia sÎ nguån lùc th«ng tin

®Þa ph−¬ng d¹ng sè phôc vô b¶o tån di s¶n vµ ph¸t triÓn kinh tÕ - x· héi, Hµ Néi.

4. http://www.calis.edu.cn 5. http://www.nlv.gov.vn

6. http://www.iadlc.nul.nagoya-u.ac.jp/

Referensi

Dokumen terkait

Nh÷ng c«ng ty nµy ®· ®ãng vai trß lín trong viÖc lµm gia t¨ng nhanh chãng sè l−îng c¸c cuéc h«n nh©n xuyªn quèc gia nµy vµ tÊt nhiªn lµ viÖc di c− còng t¨ng theo... Hai vî chång th−êng