You are on page 1of 52

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

MC LC
PHN 1: TNG QUAN V TIP NHN V ................................................................3 BIU DIN TRI THC ..................................................................................................3 1. Kho st bi ton xy dng v pht trin cc m hnh biu din tri thc cho cc h gii ton t ng................................................................................................................3 1.1 Gii thiu ...............................................................................................................3 1.2. Vn biu din tri th c........................................................................................4 1.3. M hnh tri thc cc i tng tnh ton ................................................................5 1.4 M hnh c s tri th c COKB.................................................................................7 1.4.1 M hnh........................................................................................................... 7 1.4.2 T chc c s tri thc COKB.........................................................................10 1.5. Bi ton gii ton m t C-Object...........................................................................11 1.6. Bi ton hnh hc phng ......................................................................................12 1.7. V d ..................................................................................................................13 2. Vn cn tn ti trong bi ton................................................................................13 3. Vn cn tp trung nghin cu v gii quyt ...........................................................14 PHN 2: C S L THUYT .....................................................................................15 1. Tm hiu v ngn ng t nhin...................................................................................15 1.1. nh ngha ...........................................................................................................15 1.2. Bn cht ca ngn ng ........................................................................................16 1.3. Tnh h th ng ca ngn ng ................................................................................16 1.4. c im ca ngn ng t nhin ting Vit v Ting Anh...................................18 2. Cc phng php x l ngn ng t nhin ng dng trong d ch t ng....................19 2.1. gii thiu cc ng dng ca x l ngn ng t nhin...........................................19 2.2. Mt s h dch my .............................................................................................20 2.3. Cc bi ton trong dch my ................................................................................20 PHN 3: NGHIN C U TH C NGHIM.......................................................... 28 1. M t bi ton cn x l.............................................................................................28

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB 2. Gii quyt bi ton d ch ngn ng t nhin sang ngn ng c t ..............................29 2.1. Quy c chung cho bi ton ................................................................................30 2.2. M hnh c t tng qut .....................................................................................32 3.2.3. Gii quyt vn chuyn m u cu thnh d ng tin c t .................................35 2.4. Chuyn vn bn t ngn ng t nhin sang dng ngn ng tin c t ................39 3.2.5. Chuyn t ngn ng tin c t sang ngn ng c t bi ton .........................41 3. Thit k v ci t bi ton.........................................................................................45 3.1. Thit k giao din ................................................................................................45 3.2. Cc chc nng chnh............................................................................................46 3.3. Cng ngh s dng..............................................................................................50 3.4. Nh n xt..............................................................................................................50 PHN 4: KT LUN V HNG PHT TRIN ...................................................51 1. Kt lun .....................................................................................................................51 1.1. Vn t c...................................................................................................51 1.2. Vn cha t c ..........................................................................................51 2. Hng pht trin ........................................................................................................52 TI LIU THAM KHO..............................................................................................52

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

PHN 1: TNG QUAN V TIP NHN V BIU DIN TRI THC


1. Kho st bi ton xy dng v pht trin cc m hnh biu din tri thc cho
cc h gii ton t ng
Trong phn ny ta s bn lun cc cng trnh l thuyt cng nh ng dng c lin quan n mc tiu ca ti t nu ra mc tiu c th m ti tp trung nghin cu v gii quyt. 1.1 Gii thiu Cng ngh tri thc l mt lnh vc khoa hc my tnh nhm nghin cu v xy d ng cc h thng ngy cng thng minh hn v qua h tr tt hn cho vic x l thng tin v x l tri thc, tnh ton iu khin. Hai vn ln cn quan tm trong vic phn tch v pht trin h thng thng minh, c bit l h gii ton t ng l: Biu din tri thc Phng php v k thut tm kim hay suy din

Bi ton xy d ng v pht trin cc m hnh biu din tri thc cho cc h gii ton t ng gi mt v tr rt quan trng trong khoa hc my tnh cng nh trong lnh v c tr tu nhn to. Mc tiu c a bi ton ny l nhm xy dng v pht trin mt s m hnh biu din tri thc v cc thut gii t ng cho cc dng bi ton khc nhau da trn tri th c. Trong bi ton ny ta ch quan tm kho st n vic xy dng v pht trin mt s m hnh biu din tri thc cho h gii ton t ng. Cc m hnh ny c xy d ng v pht trin da trn cc phng php biu din tri thc c vi nhng pht trin nht nh to ra mt s m hnh biu din tri th c mi th hin c nhiu dng kin thc a dng hn. Theo PGS.TS. Vn Nhn a ra mt s m hnh biu din tri thc nh: m hnh mng suy din v tnh ton, m hnh mt i tng tnh ton (C-Object), m hnh tri thc v cc C-Object, v m hnh mng cc C-Object. Cc m hnh ny c s dng trong thit k v ci t mt s chng trnh gii t ng, mt s lp bi ton v cc tam
GVHD: PGS.TS. VN NHN 3 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB gic, cc t gic, cc bi ton hnh hc ph ng, cc bi ton hnh hc gii tch v mt s bi ton trn cc phn ng ha h c. Trc ht ta cn phi bit cu trc ca mt h gii ton thng minh nh th no v m hnh biu din tri thc ng vai tr ra sao. Cu trc c bn c a m t h gii ton t ng da trn tri thc bao gm cc thnh phn c ch ra trn hnh 1.1 bn di.

Giao Ngi s dng Din

Hu chnh c s tri thc B suy din H thng con gii thch C s tri th c

Hnh 1.1 c u trc c a m t h gi i ton thng minh C th th y rng c s tri thc gi vai tr nh b no ca h thng trong cha cc kin thc cn thit cho vic gii m t bi ton. B suy din s p dng cc kin thc trong c s tri th c tm li gii cho bi ton. 1.2. Vn biu din tri thc Biu din tri thc ng vai tr rt quan trng trong h gii ton thng minh. Theo tng kt th c 4 lo i biu din tri thc khc nhau: biu din da trn logic hnh thc, biu din tri thc th tc, biu din d ng m ng, v biu din cu trc. Mi phng php ny ch biu din c mt kha cnh no ca tri thc trong khi tri thc cn c biu din da dng trong cc h ng dng. Cc phng php biu din tri thc nu trn u c u im nht nh trong biu din tng dng tri thc. Nhng tt c cc phng php ny u c m t nh c im chung l ch biu din mt kha cnh tri th c rt a dng v cha hng ti biu din m t tri th c bao hm nhiu d ng thng tin, nhiu dng s kin khc nhau. Cc h gii ton nh: cc chng trnh tnh ton hnh hc trong b phn m m Engineering 2000, chng trnh StudyWorks,

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB chng trnh Math Express... chng u c mt hn ch ln nh t l khng cho ta nhng m hnh biu din tri thc tt gip xy d ng mt c s tri thc, b suy din v cc thnh phn khc c a h thng. T ng nu ra cc m hnh biu din tri thc nh: m h nh mt i tng tnh ton (C-Object), m hnh tri th c v cc C-Object, v m hnh mng cc CObject v cc ng dng c a chng vo cc bi ton gii ton mt C-Object, cc bi ton hnh h c phng, gii cc bi ton hnh h c gii tch ba chiu, v gii m t s cc bi ton v phn ng ha hc. Ta s i vo nghin cu cch biu din tri thc c a cc h gii ton ny. 1.3. M hnh tri thc cc i tng tnh ton gip h gii ton t ng ti u c th ng dng rng ri cho nhiu bi ton phc tp, PGS.TS Vn Nhn v GS.TSKH.Hong Kim nu ra m hnh tri thc g i l m hnh tri thc cc i tng tnh ton. Trc ht ta cn tm hiu th no l mt i tng tnh ton (C-Object): l mt i tng O c cu trc bao gm: Mt danh sch cc thu c tnh Attr(O) ={x1, x2,..., xn} v gi a cc thuc tnh c lin h qua cc s kin, cc lut suy din hay cng th c tnh ton. Cc hnh vi lin quan n s suy din v tnh ton trn cc thu c tnh ca i tng nh: o Xc nh bao ng ca m t tp thuc tnh A. o Xt tnh gii c ca mt bi ton suy din tnh ton c d ng A B, vi A v B l con ca Attr(O). o Thc hin cc tnh ton. o Thc hin gi b sung gi thit cho bi ton o Xem xt tnh xc nh ca i tng Mt C-Object c th c m hnh ha bi mt b: (Attrs, F, Facts, Rules)

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Trong : Attrs l tp thuc tnh ca i tng, F l cc quan h suy din tnh ton, Facts l tp hp cc tnh ch t vn c ca i tng, v Rules l tp hp cc lu t suy din trn cc s kin. M hnh tri thc cc i tng tnh ton c th dng biu din cho mt d ng c s tri th c bao gm cc khi nim v cc i tng c cu trc cng vi cc loi quan h v cc cng thc tnh ton lin quan. Ta gi mt m hnh tri thc cc C-Object, vit tt l mt m hnh COKB (Computational Objects Knowledge Base), l m t h thng (C, H, R, Ops, Rules) g m: Mt tp hp C cc khi nim v C-Object: m i khi nim l mt lp C-Object c cu trc bn trong nh sau: o Kiu i tng o Danh sch cc thu c tnh o Quan h trn cu trc thit lp o Tp hp cc iu kin rng buc trn cc thu c tnh o Tp hp cc tnh cht ni ti trn thu c tnh. o Tp hp cc quan h suy din - tnh ton o Tp hp cc lut suy din c dng: {cc s kin gi thit} {cc s kin kt lun} Mt tp H cc quan h phn cp gia cc lo i i tng: c th ni rng H l mt biu Hasse khi xem quan h phn cp trn l m t quan h th t trn C. Mt tp R cc lo i quan h trn cc i tng: m i quan h c xc nh bi <tn quan h > v cc loi i tng ca quan h, v quan h c th c m t s tnh cht nht nh. Mt tp Ops cc ton t: cc ton t cho ta mt s php ton nht nh trn cc bin thc cng nh trn cc i tng

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Mt tp hp Rules gm cc lut c phn lp: mi lut cho ta mt qui tc suy lu n i n cc s kin m i t cc s kin no , v v mt cu trc m i lut r c th c m hnh di dng r : {sk1, sk2,..., skn} {sk1, sk2,..., skm} Mt s loi s kin: o S kin thng tin v lo i ca mt i tng. o S kin v tnh xc nh c a mt i tng (cc thuc tnh coi nh bit) hay ca m t thuc tnh. o S kin v xc nh ca m t thuc tnh hay mt i tng thng qua m t biu thc hng. o S kin v ph thuc ca mt i tng hay ca mt thuc tnh theo nh ng i tng hay cc thuc tnh khc thng qua mt cng thc tnh ton o S kin v mt quan h trn cc i tng hay trn cc thuc tnh ca i tng.

1.4 M hnh c s tri thc COKB


1.4.1 M hnh Ta g i m t m hnh tri th c v cc i tng tnh ton, vit tt l mt m hnh COKB (Computational Objects Knowledge Base), l mt h thng (C, H, R, Ops, Funcs, Rules) gm: Mt tp hp C cc khi nim v cc i tng tnh ton: Mi khi nim l mt loi i tng tnh ton c cu trc v c phn mc theo s thit lp ca cu trc i tng, gm: bin thc, i tng c bn, i tng mc 1 v i tng m c 2. Cc i tng c bn c cu trc rng ho c c cu trc gm mt s thu c tnh thuc kiu thc. Cc i tng lo i n y c th lm n n cho s thit lp cc i tng mc cao hn. Cc i tng tnh ton m c 1 c m t thuc tnh lo i <real> v c th c thit lp t mt danh sch nn cc i tng c bn.

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cc i tng tnh ton mc 2 c cc thu c tnh loi real v cc thuc tnh thuc loi i tng m c 1, v i tng c th c thit lp trn mt danh sch n n cc i tng c bn. Mt tp hp H cc quan h phn cp gia cc loi i tng Trn tp hp C ta c m t quan h phn cp theo c th c mt s khi nim l s c bit ha c a cc khi nim khc, ch ng hn nh mt tam gic cn cng l mt tam gic, m t hnh bnh hnh cng l m t t gic. C th ni rng H l mt biu Hasse khi xem quan h phn cp trn l mt quan h th t trn C. Mt tp hp R cc khi nim v cc loi quan h trn cc loi i tng Mi quan h c xc nh bi <tn quan h> v cc lo i i tng c a quan h , v quan h c th c mt s tnh cht trong cc tnh cht sau y: tnh cht ph n x, tnh ch t i xng, tnh cht phn xng v tnh cht bc cu. Mt tp hp Ops cc ton t Cc ton t cho ta m t s php ton trn cc bin th c cng nh trn cc i tng, ch ng hn cc php ton s hc v tnh ton trn cc i tng on v gc tng t nh i vi cc bin thc. Mt tp hp Funcs cc chc nng: bao gm cc chc nng trn Com-Objects. Chc nng cng l mt loi kin thc ph bin trong cc lnh v c thc t, c bit l lnh vc khoa hc t nhin nh cc lnh vc ca ton hc, lnh vc vt l. Trong hnh h c phn tch, chng ta c cc chc nng: khong cch gia hai im, khong cch t mt im n mt ng th ng ho c m t my bay, d bo ca mt im hoc mt dng ln my bay, yu t quyt nh ca ma trn vung cng l mt chc nng trn ma trn vung trong i s tuyn tnh. Mt tp hp Rules g m cc lu t

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cc lut th hin cc tri th c mang tnh ph qut trn cc khi nim v cc lo i s kin khc nhau. Mi lu t cho ta mt qui tc suy lun i n cc s kin m i t cc s kin no , v v mt cu trc n gm 2 thnh ph n chnh l: phn gi thit c a lu t v phn kt lun ca lut. Phn gi thit v phn kt lun u l cc tp hp s kin trn cc i tng nh t nh. V d: Ph n kin thc v cc tam gic v cc t gic trong hnh h c phng c th c biu din theo m hnh tri thc v cc i tng tnh ton nh di y. Cc khi nim v cc i tng gm: im. on th ng. Gc. Cc loi tam gic v cc loi t gic. Cc quan h phn cp gia cc loi i tng: Gia cc khi nim v cc loi tam gic v cc loi t gic c cc quan h phn cp theo s c bit ha ca cc khi nim, c th hin bi cc biu sau y: Cc khi nim v cc lo i quan h gia cc loi i tng: Cc quan h gi a cc khi nim bao g m cc lo i quan h nh: Quan h thu c v ca 1 im i vi mt on thng. Quan h trung im ca mt im i vi mt on thng. Quan h song song gia 2 on thng. Quan h vung gc gia 2 on thng. Quan h bng nhau gia 2 tam gic. Cc ton t:

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cc ton t s hc v cc hm s cp cng p dng i vi cc i tng loi on thng v cc i tng loi gc. Cc lut: Cc lut th hin cc nh l hay qui tc suy din trn cc lo i s kin khc nhau. V d : Mt tam gic ABC c 2 cnh AB v AC bng nhau th tam giac l tam gic cn ti A. Vi 3 on thng a, b v c, n u a // b v a c th ta c b c. 1.4.2 T chc c s tri thc COKB C s tri thc COKB c th c t chc bi mt h thng tp tin vn bn c cu trc nh sau: Tp tin Objects.txt lu tr cc nh danh cho cc lo i i tng C-Object. Tp tin RELATIONS.txt lu tr thng tin v cc loi quan h khc nhau trn cc lo i C-Object. Tp tin Hierarchy.txt lu li cc biu Hasse th hin quan h phn cp trn cc khi nim. Cc tp tin vi tn tp tin lu tr cc cu trc ca lo i i tng. Tp tin Operators.txt lu tr cc thng tin v cc ton t trn cc i tng. Tp tin FACTS.txt lu tr thng tin v cc loi s kin khc nhau. Tp tin RULES.txt lu h lut ca c s tri thc.

GVHD: PGS.TS. VN NHN

10

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Biu phn cp khi nim

Cc loi i tng

Cu trc i tng
...

Cc quan

Cc loi s kin Cc ton t Cc lu t

Cu trc i tng

Hnh 1.2 : bi u lin h gia cc thnh ph n trong m hnh COKB Do cch t chc tri thc trong m hnh COKB r rng v rnh mch vi y cc thng tin cng vi cc lin h khc nhau rt a dng. V cng chnh v th ta ph i phn tch u vo rnh mch ging nh cc thnh phn trong m hnh c s tri thc quy nh. Do bi ton s c quy nh vi cu trc c bit c gi l ngn ng c t bi ton. Ta i vo xem xt ngn ng c t bi ton ca hai h gii ton t ng: gii ton m t CObject v gii bi ton hnh h c phng. 1.5. Bi ton gii ton mt C-Object Ho t ng ca chng trnh gii ton C-Object da trn c s tri thc cc C-Object c t chc theo m hnh COKB Phn tch Gi thit: A Kt lun: B

Gii

Dch v tri th c

Li gii

Tri thc

Hnh 1.3 s hot ng gi i mt bi ton


GVHD: PGS.TS. VN NHN 11 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB a u vo cho chng trnh gii ton C-Object da trn c s tri thc cc CObject c t ch c theo m hnh COKB th cu trc ca m t bi ton c dng nh sau : begin_hypothesis parameters: objects: <cc i tng> facts: <cc s kin> ... end_hypothesis begin_goal <m c tiu c a bi ton> end_goal Cu trc bi ton ny s c ngi dng phn tch v a vo cho h v h gii ton s da vo mt s th t c chnh phn tch bi v tm li gii. 1.6. Bi ton hnh hc phng u vo c a h ny cng cn m t ngn ng c t cho bi ton: bi ton c khai bo theo cu trc sau: begin_hypothesis parameters: objects: <cc i tng> facts: <cc s kin> ... end_hypothesis begin_goal <m c tiu c a bi ton> end_goal : <kiu i tng> <cc tham bin> : <kiu i tng> <cc tham bin>

GVHD: PGS.TS. VN NHN

12

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cng vic a ra ngn ng c t cho bi ton cng phi c ngi s dng t a ra theo mu quy nh m cha c h thng no lm t ng thay cho vic ny. 1.7. V d bi ton theo ngn ng t nhin: Cho tam gic ABC, cn ti A, v cho bit trc gc nh A b ng , cnh y a bng m. Bn ngoi tam gic c hai hnh vung ABDE v ACFG. Tnh di EG. c t bi ton: begin_hypothesis parameters: objects: O1 O2 O3 O4 facts: O1.GOC[C, A, B]; O1.DOAN[B, C]; O1.A = Pi O2.A end_hypothesis begin_goal determine: end_goal O2.DOAN[E, G]; : : : : TAM_GIAC[A, B, C]; TAM_GIAC[A, G, E]; HINH_VUONG[A, E, D, B]; HINH_VUONG[A, C, F, G]; A, B, C, D, E, F, G: DIEM;

2. V n cn tn ti trong bi ton
Bi ton trn a ra m hnh biu din tri thc kh tt ph c v cho gii bi ton mt cch t ng, tuy nhin d liu u vo ca h khng phi l bi ton theo ngn ng t nhin m l theo mt nh dng cho trc, m t ngn ng c t bi ton. V th , vn gp ph i bi ton ny l khi ta mu n gii mt bi ton th trc ht chng ta ph i lm mt cch th cng a ra dng c t ca chng ri m i a vo h gii. iu

GVHD: PGS.TS. VN NHN

13

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB lm cho d liu u vo ca h gii ton khng c t nhin v gy kh khn cho ngi s dng.

3. V n cn tp trung nghin cu v gii quyt


gii quyt vn u vo cho h gii ton t ng c t nhin hn, trong ti ny em s i su vo nghin cu v xy dng h thng Dch t ngn ng t nhin sang ngn ng c t. Vn y c ngha l: khi ta nh p mt bi ton bng ngn ng t nhin th h th ng s t ng x l a ra dng ngn ng c t ca bi ton lm u vo cho h gii ton thng minh. Hng gii quyt vn : D a trn b t in ton hc c ng ngha c xy d ng v cc x l trn ngn ng t nhin nh tch t, tch cu, tch on. Ly kt qu t vic tch cu theo t lo i chuyn thnh dng tin c t cho tng mu cu. T dng tin c t ca tng loi mu cu ta a chng v d ng c t chi tit v lu xung file XML lm d liu u vo ca cc h gii ton thng minh.

GVHD: PGS.TS. VN NHN

14

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

PHN 2: C S L THUYT
1. Tm hiu v ngn ng t nhin
Trc h t ta cn phn bit thut ng ngn ng t nhin ( Natural Language), nh ting Vit, tin Anh, ting Php, ting Ngavi ngn ng nhn to (Artificial Language), nh: ngn ng my tnh (C, Pascal, C#...). C khong 5600 ngn ng trn th gii, c phn b khng ng u , c ngn ng c hng trm triu ngi s dng nh : Quan Thoi, Anh, Ty Ban Nha, Nga, Php ting Vit ng hng th 20, nhng ch c ngn ng c vi chc ngi s dng (ch yu l ngn ng ca cc b tc t ngi v hin nay cc loi ngn ng ny ang dn b mt i). Trong s 5600 ngn ng , ch c mt s t cc ngn ng l c ch vit. 1.1. nh ngha Cng nh cc phm tr khc, ngn ng cng vy c rt nhiu khi nim, sau y chng ta s tm hiu m t s khi nim v ngn ng: Ngn ng : l m t h thng nhng n v vt cht v nhng quy tc hot ng ca chng, dng lm cng c giao tip ca con ngi, c ph n nh trong thc cng ng tru tng khi bt k mt t tng, cm xc v c mun c th no. Ngn ng : l h thng tn hiu quan trng v c o nht trong giao tip ca loi ngi; l phng tin biu hin v pht trin t duy, bo lu v chuyn giao c hiu l c nht cc truyn thng lch s - vn ho ca mt dn t c. Ngn ng l mt loi h thng tn hiu bao gm mt hnh thc v m t ni dung. Ngn ng l m thanh c ngha v h thng m loi ngi dng lin lc, cm thng v din t t tng vi nhau. Ngn ng t nhin l ngn ng s dng hng ngy trong giao tip, c th l ting Anh, Php, Nht, Vit,N c th lu tr li trn my tnh di dng vn bn, email,hoc thu m li ging ni.

GVHD: PGS.TS. VN NHN

15

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Tm li, ngn ng c th c hiu l h thng nhng m, nhng t v nhng quy tc kt hp chng m nhng ngi trong cng m t cng ng dng lm phng tin giao tip vi nhau. 1.2. Bn cht ca ngn ng Ngn ng l mt hin tng x hi: khng l hin tng t nhin, c nhn, sinh vt (di truyn) v l hin tng x hi c bit. Ngn ng l phng tin giao tip quan trng nht ca con ngi : cc phng tin khc c din gii qua ngn ng. Ngn ng l hin tng trc tip ca t tng: ngn ng l phng tin ca t duy. Quan h ngn ng - t duy ( thc) hin thc tng ng vi quan h t - khi nim s vt. Ngn ng l mt h thng tn hiu n c bn cht tn hiu: ging nh tn hiu c hai mt: m t biu hin vt cht (m, ch ) v mt c biu hin (ngh a). Hai mt ci biu hin v ci c biu hin ca tn hiu ngn ng c quan h gn b vi nhau nh hai mt ca m t t giy, nhng hai mt li c quan h v on vi nhau, ngha l quan h m khng gii thch c l do, quan h ch do quy c, thoi quen c a cng ng. V y ngn ng l h thng k hiu c bit dng lm phng tin giao tip quan trng nh t ca con ngi. 1.3. Tnh h thng ca ngn ng

Cc cp trong ngn ng
Theo trnh t nh n ln, c th k ra cc n v c a ngn ng l: m v, hnh v, t, ng, cu v vn bn. m v: n v m thanh nh nht cu to v khu bit v mt biu hin vt ch t (m thanh) ca cc n v khc. Hnh v: n v nh nh t mang ngh a c cu to bi cc m v. T: n v mang ngh a c lp, c cu to bi hnh v, c chc nng nh danh. Ng: gm hai hay nhiu t c quan h ng php hay ng ngha vi nhau.
GVHD: PGS.TS. VN NHN 16 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cu: gm cc t/ng c quan h ng php hay ng ngh a vi nhau v c chc nng c b n l thng bo. Vn bn: h thng cc cu lin kt vi nhau v mt hnh thc, ng php, ng ngha v ng dng.

Cc quan h trong ngn ng


Mi loi n v k trn lm thnh mt tiu h thng trong m t h thng ln l h thng ngn ng. Ngi ta gi mi tiu h thng ca ngn ng l mt cp . V cc tiu h thng c quan h chi phi vi nhau. V d: cp cu, cp t, cp hnh v, cp m v. Cc n v ca ngn ng quan h vi nhau rt phc tp v theo nhiu kiu. C 3 quan h c t li nh t l: Quan h cp bc : n v cp b c cao hn bao gi cng bao hm n v c a cp th p hn v ngc li: V d : Cu s bao hm t,... Quan h ng on (syntagmatical relation): ni kt cc n v ngn ng thnh chui khi ngn ng i vo hot ng cn g i l tnh hnh tuyn ca ngn ng. V d : This book; this book is interesting... Quan h lin tng (associative relation): l quan h xu chui ; mt yu t xut hin vi nhng yu t khim din ng sau lng n, v nguyn tc c th thay th cho n VD: I read book (newspaper, magazine...) th cc t newspaper, magazine l tng ng vi book c th thay th c.

Cc phng din trong ngn ng


m i cp (hnh v, t, ng, cu), cc n v ngn ng thng c cc phng din sau: Hnh thi: mi quan h gia n v ngn ng vi hnh th c cu to ca n v . Ng php: mi quan h gia n v ngn ng ny vi cc n v ngn ng hu quan.

GVHD: PGS.TS. VN NHN

17

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Ng ngh a: m i quan h gia n v ngn ng vi ni dung (v m t ngha) ca n v . Ng dng : m i quan h gia n v ngn ng vi m c ch s dng ca n v . 1.4. c im ca ngn ng t nhin ting Vit v Ting Anh

c im ca ting Anh
Ting Anh c xp vo loi hnh bin cch hay cn gi l loi hnh khut chit vi nhng c im chnh nh sau : Trong hot ng ngn ng, t c bin i hnh thi. ngha ng php nm trong t . Hin tng cu to t bng cch ghp thm ph t vo gc t rt ph bin. Kt hp gia cc hnh v l cht ch . Ranh gii gia cc hnh v l kh xc nh. Ranh gii t c nhn din bng khong trng ho c du cu.

c im ca ting Vit
Ting vit c xp vo lo i hnh n lp hay cn gi l lo i hnh phi hnh thi, khng bin hnh, n tit vi nhng c im chnh nh sau : Trong hot ng ngn ng, t khng bin i hnh thi. ngha ng php nm ngoi t . Phng thc ng php ch yu l: trt t t v t h. Tn ti m t loi n v c bit, l h nh tit m ng m ca chng trng kht vi m tit, v n v cng chnh l hnh v ting vit hay cn gi ting. Ranh gii t khng c xc nh mc nhin bng khong trng nh cc ting bin hnh khc. iu ny khin cho vic phn bit hnh thi ting vit tr nn kh khn. Vic nh n din ranh gii t l quan trng lm tin cho cc x l tip theo sau nh: kim tra li chnh t, gn nhn t loi, thng k tn sut t ,.. Tn ti loi t c bit t ch loi hay cn g i l ph danh t ch lo i danh t i km vi danh t.
GVHD: PGS.TS. VN NHN 18 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB V mt ng m hc, cc m tit ting vit u mang mt trong 6 m iu : ngang, sc, huyn, hi, ng, nng. y l m v siu on tnh. Ting vit cn hin tng ly nh: lp lnh, lung linh

Tm tt cc im khc bit gia ting Anh v ting Vit.


c im n v c bn Tin t/hu t T loi Ting Khng c Khng nh ngh a r T hp c ngh a da vo ng cnh c a cc ting Ting Vit T c c nh ngh a r Da vo kho ng trng hoc d u cu. Ting Anh

Ranh gii t

B ng 3.1: s khc nhau v c im ting Anh v Ting Vit

2. Cc phng php x l ngn ng t nhin ng dng trong dch t ng


2.1. gii thiu cc ng dng ca x l ngn ng t nhin Nghin cu x l ngn ng t nhin l nh m mc ch lm cho my tnh c th t x l ngn ng t nhin, hiu c ngn ng t nhin. Hin nay kt qu ca x l ngn ng t nhin c ng dng vo rt nhiu bi ton nh: dch t ng (MACHINE TRANLATION), x l vn bn (kim tra l i chnh t, kim li vn phm, phn lo i vn bn, tm tt vn bn...), nhn dng k t (ORC) v cc ng dng khc nh: kim tra thng tin theo ng ngha, truy vn c s d liu... Trong vn d ch my l vn kh khn nh t trong vic ng dng ca tr tu nhn to vo thc t v cng l vn c tranh lu n v bn ci nhiu nht t trc n nay. Gn y vn dch my ang c quan tm mnh m v t c m t s kt qu ng khch l. Kt qu ny t c l do c c cc nghin cu m i v l thuyt ngn ng hc v s ra i ca th h my tnh mi mnh hn. Tuy nhin vic dch my cng ch hn ch n vic d ch cc ti liu k thu t, t ting Anh sang ting Vit, Anh Php,...

GVHD: PGS.TS. VN NHN

19

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB 2.2. Mt s h dch my n nay trn th gii c nhiu nhm/cng ty d ch my khc nhau: nhm SYSTRAN c a M, CETA Php... nhng ni ting v hiu qu nht l h dch Anh Php METO chuyn dch cc b n tin d bo thi tit Canada. Nam , c d n Nghin cu v trin khai h dch a ngn ng gi a Nht v cc nc Chu . Trong nhng nm gn y Nht l nc u t nhiu nht vo nhng h dch thng mi (trn my tnh c nhn PC v my cm tay PDA) d ch Nht Anh... Ti Vit Nam, cng c nhiu ti nghin cu, phn m m thc hin vic dch t ng t Anh sang Vit nh h dch ti liu Tin Hc EVT ca khoa CNTT, trng H Khoa H c T Nhin H Quc Gia TPHCM (GS.Hong Kim TS.inh in), ti dch my ca khoa CNTT, trng H Bch Khoa H Qu c Gia TPHCM (PGS.Phan Th Ti), ph n mm d ch Anh Vit EVTRAN ca Vin Cng Ngh vi in t (TS.L Khnh Hng), trang Web dch Anh Vit, Php Vit ca TS.on Nguyn Hi... Thm ch cn c nhm nghin cu kt hp vi b nhn dng v tng hp ting ni thc hin robot phin d ch ting ni ging nh ngi tht (h MOBIL). Nhn chung tt c cc h dch trn cng ch dng ch dch t ting nc ny sang ting nc khc thi: Anh Vit, Anh Php, Vit Anh,... nhng cha c h dch no l dch t ng no dch t ngn ng t nhin sang ngn ng c t ca bi ton lm u vo cho cc h gii ton t ng m nhng c t phi do con ngi lm bng tay. Trong ti ny, em s s dng kt qu ca x l ngn ng t nhin ng dng vo h dch t ng, nhng khng phi xy d ng ph n mm d ch t ting nc ny sang ting nc khc m l xy dng ph n mm dch t ngn ng t nhin sang ngn ng c t lm u vo cho cc h gii ton t ng. 2.3. Cc bi ton trong dch my thc hin vic dch vn bn ta cn ph i gii quyt m t s bi ton chnh nh sau: Tin x l: tch cu, tch on.. Phn tch hnh thi ngn ng : tch t nhn din tn ring, t vit tt.

GVHD: PGS.TS. VN NHN

20

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Phn tch t php ngn ng ngun: gn nhn t loi Phn tch c php ngn ng ngun: xy dng cy c php, quan h ng php. Phn tch ng ngh a ngn ng ngun: gn nhn ng ngha cho cc t trong cu. Chuyn i cy c php t ngn ng ngun sang ngn ng ch. Hnh thnh cu ca ngn ng ch t cy c php ngn ng ch.

Tin x l
Khi u vo ca h thng l mt on vn bn ta phi tin hnh x l s b vn bn u vo r i phn tch chng thnh cc n v r rng cho h thng chnh d x l. Bi ton tin x l s bao gm cc bc sau: Trc h t x l s b vn bn u vo l lm sch vn bn bng cch xa b nh ng k t , nhng vng khng cn thit cho h th ng. Mi on vn bn u vo s c b phn tin x l nh n din ra cc ch thch, tiu , on vn trong vn bn s th t v gch u dng. Giai on quan trng v trng tm nht c a tin x l l phn tch on vn thnh cc cu. V hn na l tch cc cu thnh cc m nh gim tnh ph c tp cho h thng cng nh cht lng v tc x l ca h thng. Giai o n x l s b on vn b n: u tin on vn bn u vo s c b ph n tin x l nh n din cc k t c bit, cc nh d ng ca vn bn sau xa b chng hoc thay th b ng k t nh dng ring do h thng quy nh hoc lu li thng tin ca chng. Sau vn bn gc s c a v dng theo quy nh c a h thng. Da vo cc nh dng ring ca h thng th vic x l s d dng hn. Giai on tch vn bn thnh on: Do s a dng v trnh by v nh dng vn bn ca ngi dng c bit l trong vn bn dng text. Do , y l mt vn kh khn trong x l tch vn bn thnh tng on y l mt kh khn rt ln cho h tin x l v khng th lng trc c ht tt c kh nng nh dng ca ngi dng.

GVHD: PGS.TS. VN NHN

21

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Ngoi ra trong cc on vn text thng thng cng c nhiu cch trnh by khc nhau. VD: on vn c th tht vo dng u tin, c th v a tht dng u tin v tht dng c cc dng cn li; u vn bn c th nh s 1, 2, 3,...; A, B, C, I, II, III,... Cng do s a dng trong cch trnh by vn bn nh vy, vic phn tch kt cu ca vn bn phn tch on gp nhiu kh khn v vic a ra nhng thng tin chnh xc v v tr c a cu cho h dch ch c th t c m t kt qu tng i. gim bt phc tp bi ton gp phi ta cn a ra quy c trnh by vn bn nh sau: Do s a dng trong cch trnh by vn bn cn d ch, m c s ca tin x l li da trn cch trnh by nn cn phi c mt quy cch trnh by chun, theo phn h tin x l c th phn bit cc thnh phn trong vn bn. Quy cch ny cng cn phi c s dng rng ri v tng i linh ho t c th ph h p vi mt lng ln cc vn bn cn d ch. V vy, quy cch trnh by c ngh d a trn cch trnh by vn bn ting Anh thng thng, c s dng nhiu trong cc vn bn hnh chnh, sch bo, cc ti liu in t... y ch l mt cch trnh by ph bin c s dng nhiu nn khng th bao ht tt c cc cch trnh by khc nhau c th c. Tuy nhin cch trnh by ny da trn nhng c im chung nht ca vn bn ting Anh c gng trnh nh m ln khi x l cc lo i vn bn kiu khc chu n. Ngoi ra, vic tch on cn ch n du hiu bt u on nh: vit hoa u dng, tht u dng...v d u hiu kt thc on nh du ch m cu... Tch cu: Trong mt on vn bn ting Anh hay a s cc ngn ng thng dng khc, thng thng th ngi ta dng du chm (.), chm than (!), ch m hi (?) v m t s su khc n a nhn bit kt thc cu. Ta gi nhng du ny l nh ng du bo hiu kt thc cu hay du chm cu. Tuy nhin do tnh nh p nhng c a d u bo hiu kt thc cu, nn vic xc nh ranh gii cu khng cn n gin nh chng ta ngh.
GVHD: PGS.TS. VN NHN 22 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB VD: du chm, c th biu th nh mt d u ch m thp phn, m t cm t vit tt, s kt thc cu vn hoc ngay c t vit tt nm cui cu vn. Mt du chm hi hay d u ch m than c th xu t hin trong d u ngoc n, ngoc kp hay cng nh cui cu. nh n din du chm cu, ngi ta c th dng cc heuristics ho c cc m hnh hc ph c tp hn: mng neural, ...

Phn tch hnh thi ngn ng


Nhn din tn ring: tn ring chc chn l nh ng chui k t m trong k t u tin phi c vit hoa, nhng cng c nhng chu i k t c vit hoa ch u (u cu, vit tt, nhn m nh...) nhng chng khng phi l tn ring. V d ta xem xt cc trng hp sau: IBM, CNTT, I.T., Hanoi, Thanh, Lan, Reading is,...trong tt c khng phi l tn ring (nh CNTT, Information Technology, Reading). V v y, bi ton nhn din tn ring nhm gii quyt cc nhp nhng ni trn. Quan phn tch trn ta thy: trong mt vn bn, vic xc nh u l tn ring (c th gi l danh t ring) khng ch n thun l da vo vit hoa hay khng vit hoa, m ph i da vo cc thng tin ng cnh chung quanh vi nhiu cp (hnh thi, ng php v thm ch c ng ngh a). nhn din c tn ring, th ngoi vic da trn hnh thi bn ngoi (vit hoa, u dng, tiu ...) ta thng xy d ng m t danh sch cc tn ring c th c (tn ngi, a danh,...) v danh sch ny c g i l gazetteer. (vic xy d ng danh sch nh th i hi thi gian v cng sc rt ln). n nay, gii quyt bi ton ny, ngi ta s dng cc phng php sau: Da trn cc heuristics: chng hn i vi cc danh hiu (title), cc t thng vit tt,...(nh Dr., TS.,...) l nhng t ring. Da trn danh sch cc tn ring (gazetteer): tn ring c th l tn ca ngi, c a t chc, ca a danh, ca sn phm,... v hin nay trn th gii (c trn Internet) ngi ta xy dng mt danh sch nh th.

GVHD: PGS.TS. VN NHN

23

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Bi ton nhn din tn ring c lin h cht ch vi bi ton nh n din d u ch m cu. V khi ta bit d u ch m l thnh phn thuc tn ring trong cc trng hp: Dr., TS.,... th ta suy ra ngay du chm khng phi l du chm cu. Vic nhn din tn ring rt cn thit trong vic phn tch vn bn gn nhn t loi, phn tch c php, phn tch ng ngha, dch t ng, tm tt vn bn, hiu vn bn,... Nhn din ranh gii t: Nh n din ranh gii t (word boundary identification) hay cn gi l phn on t (word segmentation) l mt cng on tin quyt i vi hu h t cc h x l ngn ng t nhin. i vi cc ngn ng bin hnh (ting Anh, ting Nga,...) th ranh gii t c xc nh ch yu bng khong trng hay du cu, cn i vi cc ngn ng n lp (ting Vit, ting Hoa, ting Thi,...) th khong trng khng phi l tiu ch nhn din t. Mun xc nh c ranh gii t trong cc ngn ng ny, chng ta phi d a vo cc thng tin m c cao hn, nhu h nh thi, t php, c php, ho c ng ngha hoc v th m ch c ng dng. Trong bi ton tch t, chng ta cn ph i n m vng cc tiu ch ranh gii t ting Vit c xy d ng da trn c s ngn ng hc. Tht vy, ta phi bit: xe p, cun sch, v sao, tm ra,... c ph i l t hay khng t mi a cho my cch nhn din t mt cch t ng. nh n din ranh gii t, ngi ta s dng mt s m hnh nh: MM (Maximum Matching: forward / backward hay cn gi LRMM: Left Right)... Theo phng php LRMM, phn on t ting Vit trong m t ng/cu , ta i t tri sang phi v chn t c nhiu m nht m c m t trong t in, r i c tip tc cho t k tip cho n h t cu. Vi cch ny, ta d dng tch chnh xc cc ng/cu nh: nhn dn | Vit Nam | anh hng; thnh lp | nc | Vit Nam | dn ch | cng ha,... Tuy nhin phng php ny s tch t sai trong cc trng h p: h c sinh | hc sinh | hc, mt | ng | quan ti | gii,... C nhiu cch gii quyt vn ny, nhng phng php WFST c a Richard W. Sproat c xem l phng php hiu qu nht v chnh xc ca n n 95% khi p dng cho ting Hoa. Nhng khi h a ra nhiu kt qu c chnh xc xp x nh nhau

GVHD: PGS.TS. VN NHN

24

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB th vic chn li gii ti u l mt vn kh khn. Cc tc gi Hong Kim, inh in a ra cch gii quyt cho vn ny l kt hp m ng neural ti u bi ton ny.

Phn tch t php ngn ng ngun: gn nhn t loi


xc nh lo i t c a t mt cch t ng, ch yu ta phi gii quyt trng hp nh p nhng t lo i v m t t c nhiu t loi, nhng trong cu c th n ch c th c mt t loi ng m thi. Danh sch cc t loi c th c ca mt ngn ng c gi l b nhn t lo i (POS-tagset) ca ngn ng . gn nhn t lo i ngi ta c th s dng nhiu phng php khc nhau nh: m hnh Markov n (HMM), da trn b nh (memory-based), TBL, m ng Neural, cy quyt nh,... trong phng php TBL t ra rt hiu qu v c s dng ph bin nht hin nay. Ngoi ra, phng php ny cn c u th l kh nng sa sai trn u ra ca h thng gn nhn t loi cho ting Anh bng gii thut h c fast-TBL tn l fTBL-toolkit c cng b rng ri trn th gii.

Phn tch c php ngn ng ngun


Gn nhn ranh gii ng ngha: gn nhn ranh gii ng ngha l bi ton nh du u l bt u (du [) u l kt thc (du ]) ca cc ng ngha (phrases), nh: danh ng (Noun Phrase), ng ng (Verb Phrase),... d ng nh du ny cn gi l dng ngoc (brackets). V d: [I]NP [enterV [aDet newAdj bankN]NP]VP. Nu trong mt ng khng bao hm mt ng no khc th ng c gi l ng c s (base phrase). Vic xc nh rang gii ng ph thuc vo kt qu gn nhn t lo i trc . Gn nhn quan h ng php: gn nhn quan h ng php (grammatical relations) l cng on c thc hin sau cng on gn nhn t lo i v gn nhn ranh gii ng. V d: trong cu I enter an old bank, sau khi qua hai ph n gn nhn trn ta c: [I]NP [enterV [anDet old Adj bankN]NP]VP. Bc tip theo l xc nh mt cch tng minh cc quan h ng php c th c gia cc thnh phn c php c xc nh, chng h n quan h S-V (Subject-Verb), V-O,... nh h nh sau:

GVHD: PGS.TS. VN NHN

25

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

I S-V

enter V-O

an D-N

old

A-N

bank

Hnh 2.1 cc quan h ng php Gn nhn cy c php: gn nhn cy c php hay cn g i l phn tch c php l nhm phn tch mt cu thnh nh ng thnh phn vn phm c lin quan vi nhau v c th hin thnh cy c php. Khi nhp cu, ta ph i phn thnh cc thnh ph n nh: ch ng, v ng; gn vai tr ch t/i t ca ng t chnh, b ngha,... V d: nhp cu I enter the bank, n s phn tch thnh dng nh sau: [I]NP [enterV [anDet oldAdj bankN]NP]VP v cy c php tng ng: S NP V VP NP

enter

the bank

Hnh 2.2: cy c php c a cy I enter the bank phn tch c php, ta c th dng cch tip cn d a trn lut (rule-based) hoc d a trn thng k t kho ng liu (corpus): Vi cch tip cn da trn lut, ta cn c b lut vn phm v gii thut phn tch c php. Vi cch tip cn d a trn th ng k, chng ta cn c kho ng liu m trong cc cu c phn tch c php chnh xc (ch ng hn nh ng liu PennTreeBank, SUSANNE cho ting Anh). H thng hc t kho ng liu rt ra quy lut gn nhn cy c php cho cu mi bng nhng phng php nh: Maximum Entropy, thng k,
26

GVHD: PGS.TS. VN NHN

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB im kh khn nht trong vic phn tch c php l cch chn cy c php ti u. Vi mt cu thng n to ra nhiu cy c php khc nhau, khin ta khng bit chn kt qu no cho ng.

Chuyn i c php ngn ng ngun sang ngn ng ch


Trong h dch theo chin lc chuyn i c php (syntactic-transfer-based), vic chuyn i cy c php ng vai tr rt quan trng, nh hng nhiu n cht lng dch c a h. Chuyn i cy c php nhm chuyn i mt cy c php ca ngn ng ngun (ch ng hn ting Anh) sang cy c php c a ngn ng ch (chng hn ting Vit). V d: cu ting Anh a new computer system sau khi phn tch hnh thi ng php v ng ngha ta s xy d ng v chuyn i cy c php t ngn ng ngun sang ngn ng ch nh sau:

NP

NP

Det

Adj

N1

N0

Det

N0

N1

Adj

new

computer system

mt

h thng my tnh

m i

Hnh 2.3: chuyn i cy c php Anh Vit c a m t danh ng

GVHD: PGS.TS. VN NHN

27

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

PHN 3: NGHIN CU THC NGHIM


Qua vic kh o st bi ton xy d ng v pht trin cc m hnh biu din tri thc cho h gii ton t ng ca GS.TSKH.Hong Kim v ph n c s l thuyt v x l ngn ng t nhin trong h d ch t ng. Da trn nh ng c s , trong phn ny ti s nghin cu v pht trin bi ton d ch ngn ng t nhin sang ngn ng c t v nu ln hng gii quyt ca bi ton.

1. M t bi ton cn x l
Bi ton c cp v nghin cu trong ti ny l dch t ngn ng t nhin sang ngn ng c t nh m phc v u vo cho h gii ton thng minh. u vo ca bi ton ny l mt bi ton dng ngn ng t nhin ting Vit (ngn ng ngun), quy trnh x l lm sao chuyn bi ton ny sang d ng tin c t v sau l ngn ng c t (ngn ng ch) cui cng l lu kt qu ny vo file Dacta.xml. M hnh bi ton c biu din nh hnh 4.1: bi ton

B phn chuyn ngn ng tin c t. Phn lo i gi thit kt lun

CSDL mu cu

Mu cu vi c t

mu cu vi c t

B lm sau c t Dacta.xm l

Ngn ng c t

Hnh 3.1: m hnh bi ton chuyn t ngn ng t nhin sang ngn ng c t Bi ton ny c ng dng lm u vo cho h gii ton t ng trong lnh vc ton hc.
GVHD: PGS.TS. VN NHN 28 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Trong khi cc h gii ton thng minh c th t ng gii mt bi ton nhng u vo ca n khng c t nhin m l mt bi ton c a v dng ngn ng c t quy nh cho h gii v bi ton c a v dng c t th c lm th cng bng tay, v d nh h gii ton thng minh gii mt bi ton hnh h c phng ca TS. vn Nhn m ta kh o st ph n 2. V y vn m bi ton t ra l lm sao gip u vo ca cc h gii ton thng minh c t nhin hn. Vic chuyn t mt bi ton t ngn ng t nhin sang dng ngn ng c t ca bi ton s c lm mt cch t ng. lm c iu ny ta phi da trn b t in c ng ngha c xy d ng ng dng trong lnh vc ton hc v kt qu c a h thng x l ngn ng t nhin: tch t, tch cu a ra dng m u cu theo t loi. Bi ton t ra yu cu nh sau: Input: mt bi ton Output: ngn ng c t ca bi ton

gii quyt yu cu ca bi ton ta cn thc hin cc bc ln sau: Bc 1: c file XML c s d liu mu cu (CSDL mu cu) cho trc ly tng dng mu cu a chng v ngn ng tin c t Bc 2: chuyn on vn t ngn ng t nhin sang ngn ng c t theo nh ngh a cho trc. Bc 3: t dng tin c t a on vn bn thnh dng c t chi tit output.

2. Gii quyt bi ton dch ngn ng t nhin sang ngn ng c t


gii quyt bi ton nu mc 4.1 ta cn phi a ra m t s quy c chung cho bi ton, cc m hnh c t tng qut v sau s i vo gii quyt t ng vn m bi ton t ra.

GVHD: PGS.TS. VN NHN

29

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB 2.1. Quy c chung cho bi ton gii quyt ba bc nu trn ta cn a ra quy c chung cho bi ton. Vn t ra y l lm sao c mt cu m a ra c d ng c t ca chng, quan trng l do ngha c a t. V vy em phn ra thnh 5 dng t c m t nh sau: i tng: Tn i tng Ngha i tng Tham s chnh Thu c tnh ca i tng

V d: cho A l mt im im tn i tng l DIEM Ngh a ca i tng l im Tham s chnh A l k t Cc thuc tnh Ho c cho tam gic ABC. Tam gic tn i tng l TAM_GIAC Ngh a ca i tng l tam gic Tham s chnh: c 3 k t A, B, C Cc thuc tnh: nh, gc, cnh,... Nhn chung cc i tng thng l nh ng danh t. c im: c im thng xut hin ba loi t: ng t, danh t v tnh t. c im th thuc v i tng. V d: c im thuc v im Cho M l trung im on AB. Cho B l im no n m ngoi tam gic HEK. Hay c im thu c v ng/on thng
GVHD: PGS.TS. VN NHN 30 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cho BC l phn gic gc ABD c im gm c c im mt ngi, hai ngi, ba ngi v nhiu ngi V d: Cho AK l phn gic gc BAC -> c im 1 ngi Cho gc ABC k b vi gc BCD -> c im hai ngi Cho ng th ng AB vung gc vi ng th ng TD ti M -> c im 3 ngi. Cho ng th ng TD, GH, KE ct nhau ti im M -> c im nhiu ngi. Thng thng c im thng xut hin vi cc t l, vi, ca hay ti. Thu c tnh: l cc c trng ca i tng thuc v bn cht ca i tng V d: tn ca i tng, s o ca i tng, chiu di ca i tng. Thng thng thuc tnh thng xut hin chung vi t c a Tnh cht: T thng dng: b ng, = V d: cho tam gic ABC = tam gic HEK. Cnh BC = 5 cm. Yu cu thc hin: thng l cc t: chng minh rng, tnh, so snh, tm... V d : cho tam gic ABC = tam gic HEK trong AB = 2 cm, gc B = 40, BC = 4 cm. Tnh gc HEK, on HE. c t bi ton: begin_exercise begin_problem cho tam gic ABC = tam gic HEK trong AB = 2 cm, gc B = 40, BC = 4 cm. Tnh gc HEK, on HE. end_problem begin_hypothesis [{},{[A,DIEM],[B,DIEM],[C,DIEM],[TAM_GIAC[A,B,C],TAMGIAC],[H, DIEM],[E,DIEM],[K,DIEM],[TAM_GIAC[H,E,K],TAMGIAC]},{TAM_GI

GVHD: PGS.TS. VN NHN

31

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB AC[A,B,C]=TAM_GIAC[H,E,K],DOAN[A,B].a=2,GOC[A,B,C].a=40,DOAN[B,C]. a=4}] end_hypothesis

begin_goal [[Tnh,DOAN[H,E].a],[Tnh,GOC[H,E,K].a]] end_goal

end_exercise Trong c t ny c: i tng: tam gic, im, on, gc. c im {} Thuc tnh: nh, on thuc tam gic. S o cnh, s o gc Tnh ch t D kin: hai tam gic bng nhau: tam gic ABC = tam gic HEK S o cnh AB = 2, gc ABC = 40, cnh BC = 4 Yu cu tnh ton: tnh on HE v gc HEK.

2.2. M hnh c t tng qut T nhng quy c trn ta a ra dng c t chung v tng qut cho cc thnh ph n chnh trong m u cu nh nu mc 4.2.1. Theo TS. Vn Nhn c m t s cch m t nh sau: - i tng: [<object >,<loi object>] - i tng v thuc tnh: <object>,<object>.<thuc tnh> - i tng v biu thc hng: <object> = <biu thc hng> Trng hp i tng ch c mt thuc tnh nh on th s c m t nh sau: <object>.<thu c tnh> = <biu th c h ng> - i tng v thuc tnh = i tng v thuc tnh: <object>|<object>.<thuc tnh> = <object>|<object>.<thu c tnh>
GVHD: PGS.TS. VN NHN 32 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB - i tng v thuc tnh = biu thc theo cc i tng hay thuc tnh khc: <object>|<object>.<thuc tnh> = < biu th c theo cc i tng hay thuc tnh khc > - c im v i tng lin quan: [<tn quan h>, dy 2 i tng cho quan h hai ngi] Trng hp quan h c tnh i xng c m t di dng: [<tn quan h>, {hai i tng c quan h (c th l nhiu i tng)}] Trng hp quan h c tnh i xng v tnh truyn [<tn quan h>, {ba i tng c quan h tr ln}] D a vo m t trn em a ra m t s m hnh ring cho mnh bi ton d gii quyt hn :

i tng: c m hnh theo dng


[tn i tng, ngha ca i tng] [i tng, ngha ca i tng] V d: o im im A: A <-im [A, DIEM] [DIEM[A], DIEM]

i tng v biu thc hng


i tng = biu thc hng trong trng hp i tng ch c mt thuc tnh nh on th ta m t di dng: i tng.thuc tnh = biu thc hng i tng.k hiu thuc tnh = biu thc hng V d: cnh AB = 5 cm

GVHD: PGS.TS. VN NHN

33

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB DOAN[A, B]. di = 5 DOAN[A, B].a = 5

c im v cc i tng lin quan:


[tn c im, tn i tng, tn i tng lin quan] [tn c im, i tng, tn i tng lin quan] [tn c im, i tng, i tng lin quan] V d: Phn gic ca gc: AK l phn gic ca gc BAC [PHANGIAC, AK, BAC] [PHANGIAC, DOAN[A, K], BAC] [PHANGIAC, DOAN[A, K], GOC[B, A, C]]

i tng c to ra t c im ca cc i tng khc:


Tn i tng = [tn c im, danh sch tn i tng lin quan] Tn i tng = [tn c im, danh sch i tng lin quan] V d: cho 3 ng thng dd, tt, zz ct nhau ti im M. M= [CATNHAU, dd, tt, zz] M=[CATNHAU,DUONGTHANG[d,d],DUONGTHANG[t,t],DUONGTHA NG[z,z]]

Thuc tnh ca i tng


i tng.thu c tnh i tng.k hiu thu c tnh V d : + S o ca gc BAC: GOC[B,A,C].s o GOC[B, A, C].a

i tng c thuc tnh = biu thc hng hay gi tr


i tng.thu c tnh = biu thc hng hay gi tr i tng.k hiu thu c tnh = biu thc hng hay gi tr V d :
GVHD: PGS.TS. VN NHN 34 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Din tch tam gic ABC = 5 cm2 TAM_GIAC[A, B, C].din tch = 5 TAM_GIAC[A, B, C].S = 5

Thuc tnh ca mt i tng tnh cht vi thuc tnh ca i tng khc


i tng. thu c tnh tnh cht i tng.thuc tnh V d: s o on AB = s o on BC DOAN[A, B].a = DOAN[B, C].a

Yu cu, thuc tnh v i tng


[yu cu, i tng.thuc tnh] V d: tnh chu vi tam gic ABC [Tnh, TAM_GIAC[A, B, C].C]

Yu cu, i tng v i tng


[yu cu, i tng, i tng] V d: so snh gc ABC v gc BAC [So Snh, GOC[A, B, C], GOC[B, A, C]]

Yu cu, i tng c im vi i tng


[yu cu, [c im, i tng, i tng lin quan]] V d: Tm cnh tng ng vi cnh BC trong tam gic HEK [Tm, [tng ng, DOAN[B, C], TAM_GIAC[H, E, K]]] 3.2.3. Gii quyt vn chuyn mu cu thnh dng tin c t chuyn mu cu thnh ngn ng tin c t ta phi c mu cu t file XML CSDL mu cu c sn v mi m u cu l cc thnh phn chnh nh ta phn tch mc 3.2.1. File XML CSDL mu cu c t chc nh sau: <dataroot> <Maucau>
GVHD: PGS.TS. VN NHN 35 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB <Cau>........</Cau> </Maucau> </dataroot> V d: <dataroot> <Maucau> <Cau>cho|ten|l|dacdiem|doituong|ten</Cau> </Maucau> <Maucau> <Cau>cho|doituong|ten</Cau> </Maucau> <Maucau> <Cau>cho|doituong|ten|l|doituong</Cau> </Maucau> ..... </dataroot> C hai d ng m u cu: mu cu gi thit v mu cu kt lu n. Mu cu gi thit l cc m u cu nu ln cc i tng, s kin lin quan thng bt u vi cc t: cho, bit... hoc b t u bng mt i tng: V d: cho tam gic ABC -> cho|i tng|tn t m u cu trn ta a ra dng tin c t nh sau: cho|[tn, i tng] cho ABC l tam gic -> cho|tn|l|i tng Cho|[tn,i tng] cho tam gic ABC, cnh AB = 5 cm, cnh BC = 10 cm. Cho|i tng|tn|i tng|tn|tnh cht|s lng|i tng|tn|tnh cht|s lng.
GVHD: PGS.TS. VN NHN 36 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cho|[tn,i tng]|[tn,i tng]|tnh cht|s lng|[tn,i tng]|tnh cht|s lng. Mu cu kt lun l cc mu cu a ra cc yu cu ca bi ton thng b t u bng cc t: tnh, so snh, chng minh, tm,... v chng s c a v c t ring cho m u cu kt lun V d: Tnh chu vi tam gic ABC Tnh|thuc tnh|i tng|tn Tin c t s c dng: [Tnh, [tn,i tng].thu c tnh] Tm s o gc ABC Tm|thuc tnh|ca|i tng|tn Tin c t s c dng: [Tm,[tn,i tng].thuc tnh] Thut ton s b nh sau: B1: c file XML CSDL mu cu ly tng lo i m u cu. B2: Kim tra mu cu n u l mu cu kt lu n nhy n B4 B3: Gn tin c t bt u nh ngha theo mu cu gi thit nhy n B5 B4: Gn tin c t bt u nh ngha theo mu cu kt lun B5: duyt m u cu theo t loi a v d ng tin c t nh ngh a mc B6: lu mu cu vi c t vo file XML B7: Quay li B1 khi cn m u cu.

GVHD: PGS.TS. VN NHN

37

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

Ly tng mu cu

CSDL mu cu

Kim tra m u cu Gi thit Gn chui c t bt u theo mu cu gi thit

Kt lun

Gn chui c t b t du theo mu cu kt lun

Chuyn mu cu thnh dng tin c t

Mu cu vi tin c t

Hnh 3 .2 s gi i thu t chuyn mu cu thnh d ng tin c t . File mu cu vi c t c thit k nh sau: <dataroot> <Maucau> <Cau>........</Cau> <Tdacta>........</Tdacta> </Maucau> </dataroot>

GVHD: PGS.TS. VN NHN

38

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB V d: <dataroot> <Maucau> <Cau>cho|doituong|ten</Cau> <Tdacta>cho|[ten, doituong]</Tdacta> </Maucau> <Maucau> <Cau>tnh|thuoctinh|cua|doituong|ten</Cau> <Tdacta>[tnh,[ten, doituong].thuoctinh]</Tdacta> </Maucau> ... </dataroot> 2.4. Chuyn vn bn t ngn ng t nhin sang dng ngn ng tin c t cho bi ton gim i ph c tp khi chuyn t ngn ng t nhin sang ngn ng c t ta cn qua bc trung gian l chuyn vn bn u vo v d ng ngn ng tin c t, ri ly kt qu t tin c t chuyn qua c t. Trc ht ta s xem cc v d a ra thut ton gii quyt vn : V d 1: cho tam gic ABC. Cnh AB = 5 cm, cnh BC = 10 cm, cnh AC = 8 cm. Tnh chu vi tam gic ABC. Trc ht ta cn tch on vn bn ra thnh tng cu ring bit v chuyn chng v dng mu cu vi cc thnh phn chnh: Cho tam gic ABC cho|i tng|tn tin c t: cho|[tn, i tng]

- Cnh AB = 5 cm, cnh BC = 10 cm, cnh AC = 8 cm. i tng|tn|tnh cht|s lng| i tng|tn|tnh ch t|s lng| i tng|tn|tnh cht|s lng| Tin c t: tng]=s lng - Tnh chu vi tam gic ABC Tnh|thuc tnh|i tng|tn Tin c t: [Tnh,[tn,i tng].thu c tnh] [tn,i tng]=s lng|[tn,i tng]=s lng|[tn,i

GVHD: PGS.TS. VN NHN

39

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Sau khi a v dng mu cu vi cc i tng chnh ta s tch cu thnh tng t v a chng v d ng tin c t ca tng lo i m u cu theo nh ngh a trc. - Cho|tam gic|ABC Cho|[ABC,tam gic] - Cnh|AB|=|5|Cnh|BC|=|10|Cnh|AC|=|8 [AB,cnh]=5|[BC,cnh]=10|[AC,cnh]=8 - Tnh|chu vi|tam gic|ABC [Tnh,[ABC,tam gic].chuvi] V d 2: cho im M l trung im on BC. on BC = 5 cm. Ch ng minh on BM v on MC bng nhau. Cho im M l trung im on BC

Cho|i tng|tn|l|c im|i tng|tn Tin c t: Cho|[tn,i tng],[tn,i tng]|[c im, tn, tn] on BC = 5 cm i tng| tn|tnh cht|s lng Tin c t: [tn,i tng]=s lng Ch ng minh on BM v on MC bng nhau chng minh|i tng|tn|v|i tng|tn|tnh cht Tin c t: [Chng minh,[tnh cht, tn, tn]] on vn bn vi ngn ng tin c t: Cho|im|M|l|trung im|on|BC

Cho|[M,im],[BC,on]|[trung im, M, BC] on|BC|=|5 -> [BC, on]=5 Ch ng minh|on|BM|on|CM|b ng nhau

[ch ng minh,[b ng nhau, BM, MC]] T cc v d trn ta a ra thut ton nh sau: B1: tch on vn thnh tng cu ring bit B2: tch cu thnh tng t ring bit B3: duyt tng cu chuyn thnh dng mu cu theo t loi

GVHD: PGS.TS. VN NHN

40

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB


B4: l y dng tin c t ng vi mu cu trong file mu cu v tin c t

B5: duyt m u tin c t ly t theo t loi tng ng. B6: ngn ng tin c t bi ton.

bi ton

tch t v gn nhn t lo i

Tch cu chuyn thnh mu cu theo t loi

Tin c t tng ng vi mu cu

Mu cu v tin c t

Duyt tin c t ly t tng ng vi t loi

Ngn ng tin c t bi ton Hnh 4.3: s gi i thu t chuy n ngn ng t nhin sang ngn ng tin c t . 3.2.5. Chuyn t ngn ng tin c t sang ngn ng c t bi ton y l ch n cu i cng c a bi ton dch t ngn ng t nhin sang ngn ng c t. Sau khi chuyn t ngn ng tin c t sang ngn ng c t ta s lu vo file dacta.xml c cu trc nh sau <exsercise> <problem> bi ton </problem>

GVHD: PGS.TS. VN NHN

41

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB <hypothesis> gi thit bi ton cho </hypothesis> <goal> Yu cu bi ton (kt lun) </goal> </exsercise > Trc ht ta s xem xt cc v d sau: V d 1: cho tam gic ABC, cnh AB = cnh BC = 5 cm, gc BAC = 600. Tm di cnh AC v chu vi tam gic ABC. Qua cc bc 4.2.3 v 4.2 .4 ta c ngn ng tin c t nh sau: cho|[ABC,tam gic]|[AB,cnh]=[BC,cnh]=5|[BAC,gc]=60|[[tnh,

[AC,cnh].a], [tnh, [ABC,tam gic].chu vi]] t ngn ng tin c t trn ta ph i chuyn sang ngn ng c t nh sau: gi thit: [{},{[A,DIEM], [B,DIEM], [C,DIEM],[TAM_GIAC[A,B,C],

TAM_GIAC]},{DOAN[A,B].a=DOAN[B,C].a=5,GOC[B,A,C].a=60}] kt lun: [[Tnh,DOAN[A,C].a],[Tnh,TAM_GIAC[A,B,C].C]] kt qu c t c lu tr vo file dacta.xml nh sau: <exsercise> <problem> cho tam gic ABC, cnh AB = cnh BC = 5 cm, gc BAC = 600. Tm di cnh AC v chu vi tam gic ABC. </problem> <hypothesis> [{},{[A,DIEM],[B,DIEM],[C,DIEM],[TAM_GIAC[A,B,C],TAM_GIA C]},{DOAN[A,B].a=DOAN[B,C].a=5,GOC[B,A,C].a=60}] </hypothesis> <goal> [[Tnh,DOAN[A,C].a],[Tnh,TAM_GIAC[A,B,C].C]]
GVHD: PGS.TS. VN NHN 42 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB </goal> </exsercise > V d 2: V gc ABC c s o bng 560. V gc ABC k b vi gc ABC. Hi s o c a gc ABC? Ngn ng tin c t bi ton: V|[ABC, gc].a=56|v|[ABC, gc],[k b, ABC, BAC] | [h i, [ABC, gc].a ] Ngn ng c t: Gi thit: [{},{[A,DIEM],[B,DIEM],[C,DIEM],[C,DIEM]},{GOC[A,B,C].a=56,[KE BU, GOC[A,B,C],GOC[A,B,C]]}] Kt lu n: [[Hi,GOC[A,B,C].a]] kt qu c t c lu tr vo file Dacta.xml nh sau: <exsercise> <problem> V gc ABC c s o bng 560. V gc ABC k b vi gc ABC. H i s o ca gc ABC? </problem> <hypothesis> [{},{[A,DIEM],[B,DIEM],[C,DIEM],[C,DIEM]},{GOC[A,B,C].a=56, [KEBU, GOC[A,B,C],GOC[A,B,C]]}] </hypothesis> <goal> [[Hi,GOC[A,B,C].a]] </goal>
GVHD: PGS.TS. VN NHN 43 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB </exsercise > T hai v d trn ta a ra thut ton s b nh sau: B1: tch chu i tin c t ra thnh tng t ti cc k hiu c bit trong chui B2: duyt tng t trong chui tin c t. B3: nh ngh a cc bin lin quan cu thnh i tng. B4: nh ngh a i tng theo dng c t B5: nh ngh a cc s kin ca bi ton B6: nh ngh a cc yu cu ca bi ton B7: duyt n ht chui tin c t ta c cc d kin lin quan ca bi ton theo ngn ng c t lu vo file Dacta.xml Chui tin c t Tch chui thnh

Duyt tng t

nh ngh a bin lin

nh ngha i

nh ngha cc s

nh ngh a yu cu File lu c t bi ton

Chui c t

Hnh 3 .4: s gi i thu t chuyn t ngn ng tin c t sang c t

GVHD: PGS.TS. VN NHN

44

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

3. Thit k v ci t bi ton
3.1. Thit k giao din Phn mm c thit k trn giao din Window Form bao gm mt form chnh v m t form ph.

Form ph dng load t in c ng ngha c nghin cu v xy dng phc v cho bi ton ny. Form chnh c thit k bao gm: mt hp textbox dng nhp vn bn u vo, m t textbox ch c c xut vn bn u ra, v bn nt lnh vi cc chc nng: xem t in, a vn bn v dng tin c t, c t, v thot chng trnh.

GVHD: PGS.TS. VN NHN

45

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

Hnh 3.5 mn hnh giao din ph n mm 3.2. Cc chc nng chnh.

Chc nng dch t ngn ng t nhin sang ngn ng tin c t


Chc nng ny s dch mt bi ton t ngn ng t nhin sang ngn ng tin c t, kt qu xut hin trong textbox. Sau khi ch y ng dng ln, bn nh p bi ton trn hp textbox bi ton v chn nt lnh Tin c t kt qu s xut hin trong hp textbox bi ton sau khi dch nh h nh 3.6:

GVHD: PGS.TS. VN NHN

46

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

Hnh 3.6: mn hnh d ch t ngn ng t nhin sang ngn ng tin c t

Chc nng dch t ngn ng t nhin sang ngn ng c t


Tng t nh chc nng trn, chc nng ny s d ch mt bi ton t ngn ng t nhin sang ngn ng c t, kt qu xut hin trong textbox. Sau khi chy ng dng ln, bn nh p bi ton trn hp textbox on vn v chn nt c t ng dng s hin ra hp thoi thng bo kt qu c t c lu xung file Dacta.xml nh hnh 3.7:

GVHD: PGS.TS. VN NHN

47

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

Hnh 3.7: mn hnh khi ch n nt c t Tip theo bn chn OK, kt qu ngn ng c t s hin th trong hp textbox on vn sau khi tch nh hnh 3.8:

Hnh 3.8: mn hnh hin ngn ng c t


GVHD: PGS.TS. VN NHN 48 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Sau khi th c hin c t xong, ta cng c th m file Dacta.xml xem kt qu c lu tr nh th no.

Hnh 3.9: kt qu lu trong file Dacta.xml

Chc nng load t in


xem cu trc t in ta chn vo nt lnh T in form t in s xut hin nh h nh 4.10:

Hnh 3.10: mn hnh load t in WordNet


GVHD: PGS.TS. VN NHN 49 HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

3.3. Cng ngh s dng Phn m n xy d ng trn nn .Net, ngn ng s dng ci t l Visual C# theo hng i tng. Bn cnh phn m m cn s dng cng ngh XML lu tr v truy xut d liu. 3.4. Nhn xt Trong thi gian nghin cu, ti xy d ng c h thng dch t ngn ng t nhin sang ngn ng c t vi cc chc nng nh: dch vn bn t ngn ng t nhin sang ngn ng tin c t, dch vn bn t ngn ng t nhin sang ngn ng c t. H thng c ci t v th nghim t c kt qu sau: u im: h thng bc u thc hin c vic dch ngn ng t nhin sang ngn ng c t ng d ng trong bi ton hnh hc v t c kt qu kh quan p ng c yu cu t ra ca ti. Khuyt im: tuy nhin, h thng cha x l c cc u vo khng r rng, ch a p dng c cho cc lnh vc ton khc do kho d liu cha .

GVHD: PGS.TS. VN NHN

50

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

PHN 4: KT LUN V HNG PHT TRIN


1. Kt lun
ti tp trung nghin cu v pht trin h th ng dch ngn ng t nhin sang ngn ng c t lm u vo cho cc h gii ton t ng. h thng ny c th gip ngi s d ng cc h gii ton t ng dch mt bi ton t ngn ng t nhin sang ngn ng c t m t cch t ng. 1.1. Vn t c V mt l thuyt, ti nghin cu m t s m hnh biu din tri thc COKB v ngn ng c t cho c s tri thc c xy dng trc . Nhng ngn ng c t bi ton cha c d ch mt cch t ng m ch th c hin th cng b ng tay. T a ra hng gii quyt v cc thut ton cho bi ton dch t ngn ng t nhin sang ngn ng c t m t cch t ng. ng dng cc thut ton a ra xy dng c h thng dch t ngn ng t nhin sang ngn ng c t ng dng trong lnh vc ton h c m c th l ton hnh h c. H thng ny t c m t s kt qu kh quan v c th ng dng u vo cho h gii ton t ng. Bn cnh qua ti em cn tm hiu c cc cng ngh mi hin nay v ng dng chng vo xy dng h thng nh cng ngh XML, cch t chc, lu tr v truy xut chng. Lp trnh C# theo hng i tng v truy xu t XML b ng C#. 1.2. Vn cha t c D liu ca chng trnh cn hn ch ton hnh hc cha m rng ra cc lnh vc khc, nn cha th p dng vo cc bi ton khc nh: ha, l, sinh, Do thi gian nghin cu ngn, tip xc vi cc cng ngh mi, lnh v c mi, v vn kin thc cn h n hp nn ti ch dng li mt ngng gii h n. Trong qu trnh ci t v x l h thng cn mc mt s li nh khng th kim sot c.

GVHD: PGS.TS. VN NHN

51

HVTH: L NHT TRNG CH1101150

Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB

2. Hng pht trin


Tip tc pht trin v hon thin h thng dch ngn ng t nhin sang ngn ng c t v tin ti xy dng h thng ng dng dch c trong nhiu bi ton: vt l, ha h c, sinh hc, gii tch, ng dng h thng c th tch hp vo cc cng trnh gii ton c xy d ng trc lm cho u vo ca h thng tr nn t nhin hn, thn thin hn.

TI LIU THAM KHO


Ting Vit [1] Vn Nhn (2001), xy dng h tnh ton thng minh, xy dng v pht trin cc m hnh biu din tri thc cho cc h gii ton t ng, Lun vn tin s [2] inh in (2006), Gio trnh x l ngn ng t nhin, Nh xu t bn i hc quc gia TP H Ch Minh. [3] Nguyn Trung Hiu, Tm hiu ngn ng XML. [4] Phm Hu Khang, Gio trnh XML. [5] Hong Kim, Gio trnh Cng Ngh Tri Thc V ng Dng.

Ting Anh [8] Brad Leupen, R.Allen Wyke, Sultan Rehman, XML Programming. [9] OReilly, Jesse Liberty, Programming C#, - Windows Forms Programming with C#, Erik Brown, Manning. [10] The eXperTs Voice in .NET, Beginning XML with C# 2008, From Novice to Professional, Bipin Joshi Master the .NET Frameworks XML features to build powerful, data-driven applications. [11] http://msdn.microsoft.com

GVHD: PGS.TS. VN NHN

52

HVTH: L NHT TRNG CH1101150

You might also like