Professional Documents
Culture Documents
MC LC
PHN 1: TNG QUAN V TIP NHN V ................................................................3 BIU DIN TRI THC ..................................................................................................3 1. Kho st bi ton xy dng v pht trin cc m hnh biu din tri thc cho cc h gii ton t ng................................................................................................................3 1.1 Gii thiu ...............................................................................................................3 1.2. Vn biu din tri th c........................................................................................4 1.3. M hnh tri thc cc i tng tnh ton ................................................................5 1.4 M hnh c s tri th c COKB.................................................................................7 1.4.1 M hnh........................................................................................................... 7 1.4.2 T chc c s tri thc COKB.........................................................................10 1.5. Bi ton gii ton m t C-Object...........................................................................11 1.6. Bi ton hnh hc phng ......................................................................................12 1.7. V d ..................................................................................................................13 2. Vn cn tn ti trong bi ton................................................................................13 3. Vn cn tp trung nghin cu v gii quyt ...........................................................14 PHN 2: C S L THUYT .....................................................................................15 1. Tm hiu v ngn ng t nhin...................................................................................15 1.1. nh ngha ...........................................................................................................15 1.2. Bn cht ca ngn ng ........................................................................................16 1.3. Tnh h th ng ca ngn ng ................................................................................16 1.4. c im ca ngn ng t nhin ting Vit v Ting Anh...................................18 2. Cc phng php x l ngn ng t nhin ng dng trong d ch t ng....................19 2.1. gii thiu cc ng dng ca x l ngn ng t nhin...........................................19 2.2. Mt s h dch my .............................................................................................20 2.3. Cc bi ton trong dch my ................................................................................20 PHN 3: NGHIN C U TH C NGHIM.......................................................... 28 1. M t bi ton cn x l.............................................................................................28
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB 2. Gii quyt bi ton d ch ngn ng t nhin sang ngn ng c t ..............................29 2.1. Quy c chung cho bi ton ................................................................................30 2.2. M hnh c t tng qut .....................................................................................32 3.2.3. Gii quyt vn chuyn m u cu thnh d ng tin c t .................................35 2.4. Chuyn vn bn t ngn ng t nhin sang dng ngn ng tin c t ................39 3.2.5. Chuyn t ngn ng tin c t sang ngn ng c t bi ton .........................41 3. Thit k v ci t bi ton.........................................................................................45 3.1. Thit k giao din ................................................................................................45 3.2. Cc chc nng chnh............................................................................................46 3.3. Cng ngh s dng..............................................................................................50 3.4. Nh n xt..............................................................................................................50 PHN 4: KT LUN V HNG PHT TRIN ...................................................51 1. Kt lun .....................................................................................................................51 1.1. Vn t c...................................................................................................51 1.2. Vn cha t c ..........................................................................................51 2. Hng pht trin ........................................................................................................52 TI LIU THAM KHO..............................................................................................52
Bi ton xy d ng v pht trin cc m hnh biu din tri thc cho cc h gii ton t ng gi mt v tr rt quan trng trong khoa hc my tnh cng nh trong lnh v c tr tu nhn to. Mc tiu c a bi ton ny l nhm xy dng v pht trin mt s m hnh biu din tri thc v cc thut gii t ng cho cc dng bi ton khc nhau da trn tri th c. Trong bi ton ny ta ch quan tm kho st n vic xy dng v pht trin mt s m hnh biu din tri thc cho h gii ton t ng. Cc m hnh ny c xy d ng v pht trin da trn cc phng php biu din tri thc c vi nhng pht trin nht nh to ra mt s m hnh biu din tri th c mi th hin c nhiu dng kin thc a dng hn. Theo PGS.TS. Vn Nhn a ra mt s m hnh biu din tri thc nh: m hnh mng suy din v tnh ton, m hnh mt i tng tnh ton (C-Object), m hnh tri thc v cc C-Object, v m hnh mng cc C-Object. Cc m hnh ny c s dng trong thit k v ci t mt s chng trnh gii t ng, mt s lp bi ton v cc tam
GVHD: PGS.TS. VN NHN 3 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB gic, cc t gic, cc bi ton hnh hc ph ng, cc bi ton hnh hc gii tch v mt s bi ton trn cc phn ng ha h c. Trc ht ta cn phi bit cu trc ca mt h gii ton thng minh nh th no v m hnh biu din tri thc ng vai tr ra sao. Cu trc c bn c a m t h gii ton t ng da trn tri thc bao gm cc thnh phn c ch ra trn hnh 1.1 bn di.
Hu chnh c s tri thc B suy din H thng con gii thch C s tri th c
Hnh 1.1 c u trc c a m t h gi i ton thng minh C th th y rng c s tri thc gi vai tr nh b no ca h thng trong cha cc kin thc cn thit cho vic gii m t bi ton. B suy din s p dng cc kin thc trong c s tri th c tm li gii cho bi ton. 1.2. Vn biu din tri thc Biu din tri thc ng vai tr rt quan trng trong h gii ton thng minh. Theo tng kt th c 4 lo i biu din tri thc khc nhau: biu din da trn logic hnh thc, biu din tri thc th tc, biu din d ng m ng, v biu din cu trc. Mi phng php ny ch biu din c mt kha cnh no ca tri thc trong khi tri thc cn c biu din da dng trong cc h ng dng. Cc phng php biu din tri thc nu trn u c u im nht nh trong biu din tng dng tri thc. Nhng tt c cc phng php ny u c m t nh c im chung l ch biu din mt kha cnh tri th c rt a dng v cha hng ti biu din m t tri th c bao hm nhiu d ng thng tin, nhiu dng s kin khc nhau. Cc h gii ton nh: cc chng trnh tnh ton hnh hc trong b phn m m Engineering 2000, chng trnh StudyWorks,
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB chng trnh Math Express... chng u c mt hn ch ln nh t l khng cho ta nhng m hnh biu din tri thc tt gip xy d ng mt c s tri thc, b suy din v cc thnh phn khc c a h thng. T ng nu ra cc m hnh biu din tri thc nh: m h nh mt i tng tnh ton (C-Object), m hnh tri th c v cc C-Object, v m hnh mng cc CObject v cc ng dng c a chng vo cc bi ton gii ton mt C-Object, cc bi ton hnh h c phng, gii cc bi ton hnh h c gii tch ba chiu, v gii m t s cc bi ton v phn ng ha hc. Ta s i vo nghin cu cch biu din tri thc c a cc h gii ton ny. 1.3. M hnh tri thc cc i tng tnh ton gip h gii ton t ng ti u c th ng dng rng ri cho nhiu bi ton phc tp, PGS.TS Vn Nhn v GS.TSKH.Hong Kim nu ra m hnh tri thc g i l m hnh tri thc cc i tng tnh ton. Trc ht ta cn tm hiu th no l mt i tng tnh ton (C-Object): l mt i tng O c cu trc bao gm: Mt danh sch cc thu c tnh Attr(O) ={x1, x2,..., xn} v gi a cc thuc tnh c lin h qua cc s kin, cc lut suy din hay cng th c tnh ton. Cc hnh vi lin quan n s suy din v tnh ton trn cc thu c tnh ca i tng nh: o Xc nh bao ng ca m t tp thuc tnh A. o Xt tnh gii c ca mt bi ton suy din tnh ton c d ng A B, vi A v B l con ca Attr(O). o Thc hin cc tnh ton. o Thc hin gi b sung gi thit cho bi ton o Xem xt tnh xc nh ca i tng Mt C-Object c th c m hnh ha bi mt b: (Attrs, F, Facts, Rules)
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Trong : Attrs l tp thuc tnh ca i tng, F l cc quan h suy din tnh ton, Facts l tp hp cc tnh ch t vn c ca i tng, v Rules l tp hp cc lu t suy din trn cc s kin. M hnh tri thc cc i tng tnh ton c th dng biu din cho mt d ng c s tri th c bao gm cc khi nim v cc i tng c cu trc cng vi cc loi quan h v cc cng thc tnh ton lin quan. Ta gi mt m hnh tri thc cc C-Object, vit tt l mt m hnh COKB (Computational Objects Knowledge Base), l m t h thng (C, H, R, Ops, Rules) g m: Mt tp hp C cc khi nim v C-Object: m i khi nim l mt lp C-Object c cu trc bn trong nh sau: o Kiu i tng o Danh sch cc thu c tnh o Quan h trn cu trc thit lp o Tp hp cc iu kin rng buc trn cc thu c tnh o Tp hp cc tnh cht ni ti trn thu c tnh. o Tp hp cc quan h suy din - tnh ton o Tp hp cc lut suy din c dng: {cc s kin gi thit} {cc s kin kt lun} Mt tp H cc quan h phn cp gia cc lo i i tng: c th ni rng H l mt biu Hasse khi xem quan h phn cp trn l m t quan h th t trn C. Mt tp R cc lo i quan h trn cc i tng: m i quan h c xc nh bi <tn quan h > v cc loi i tng ca quan h, v quan h c th c m t s tnh cht nht nh. Mt tp Ops cc ton t: cc ton t cho ta mt s php ton nht nh trn cc bin thc cng nh trn cc i tng
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Mt tp hp Rules gm cc lut c phn lp: mi lut cho ta mt qui tc suy lu n i n cc s kin m i t cc s kin no , v v mt cu trc m i lut r c th c m hnh di dng r : {sk1, sk2,..., skn} {sk1, sk2,..., skm} Mt s loi s kin: o S kin thng tin v lo i ca mt i tng. o S kin v tnh xc nh c a mt i tng (cc thuc tnh coi nh bit) hay ca m t thuc tnh. o S kin v xc nh ca m t thuc tnh hay mt i tng thng qua m t biu thc hng. o S kin v ph thuc ca mt i tng hay ca mt thuc tnh theo nh ng i tng hay cc thuc tnh khc thng qua mt cng thc tnh ton o S kin v mt quan h trn cc i tng hay trn cc thuc tnh ca i tng.
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cc i tng tnh ton mc 2 c cc thu c tnh loi real v cc thuc tnh thuc loi i tng m c 1, v i tng c th c thit lp trn mt danh sch n n cc i tng c bn. Mt tp hp H cc quan h phn cp gia cc loi i tng Trn tp hp C ta c m t quan h phn cp theo c th c mt s khi nim l s c bit ha c a cc khi nim khc, ch ng hn nh mt tam gic cn cng l mt tam gic, m t hnh bnh hnh cng l m t t gic. C th ni rng H l mt biu Hasse khi xem quan h phn cp trn l mt quan h th t trn C. Mt tp hp R cc khi nim v cc loi quan h trn cc loi i tng Mi quan h c xc nh bi <tn quan h> v cc lo i i tng c a quan h , v quan h c th c mt s tnh cht trong cc tnh cht sau y: tnh cht ph n x, tnh ch t i xng, tnh cht phn xng v tnh cht bc cu. Mt tp hp Ops cc ton t Cc ton t cho ta m t s php ton trn cc bin th c cng nh trn cc i tng, ch ng hn cc php ton s hc v tnh ton trn cc i tng on v gc tng t nh i vi cc bin thc. Mt tp hp Funcs cc chc nng: bao gm cc chc nng trn Com-Objects. Chc nng cng l mt loi kin thc ph bin trong cc lnh v c thc t, c bit l lnh vc khoa hc t nhin nh cc lnh vc ca ton hc, lnh vc vt l. Trong hnh h c phn tch, chng ta c cc chc nng: khong cch gia hai im, khong cch t mt im n mt ng th ng ho c m t my bay, d bo ca mt im hoc mt dng ln my bay, yu t quyt nh ca ma trn vung cng l mt chc nng trn ma trn vung trong i s tuyn tnh. Mt tp hp Rules g m cc lu t
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cc lut th hin cc tri th c mang tnh ph qut trn cc khi nim v cc lo i s kin khc nhau. Mi lu t cho ta mt qui tc suy lun i n cc s kin m i t cc s kin no , v v mt cu trc n gm 2 thnh ph n chnh l: phn gi thit c a lu t v phn kt lun ca lut. Phn gi thit v phn kt lun u l cc tp hp s kin trn cc i tng nh t nh. V d: Ph n kin thc v cc tam gic v cc t gic trong hnh h c phng c th c biu din theo m hnh tri thc v cc i tng tnh ton nh di y. Cc khi nim v cc i tng gm: im. on th ng. Gc. Cc loi tam gic v cc loi t gic. Cc quan h phn cp gia cc loi i tng: Gia cc khi nim v cc loi tam gic v cc loi t gic c cc quan h phn cp theo s c bit ha ca cc khi nim, c th hin bi cc biu sau y: Cc khi nim v cc lo i quan h gia cc loi i tng: Cc quan h gi a cc khi nim bao g m cc lo i quan h nh: Quan h thu c v ca 1 im i vi mt on thng. Quan h trung im ca mt im i vi mt on thng. Quan h song song gia 2 on thng. Quan h vung gc gia 2 on thng. Quan h bng nhau gia 2 tam gic. Cc ton t:
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cc ton t s hc v cc hm s cp cng p dng i vi cc i tng loi on thng v cc i tng loi gc. Cc lut: Cc lut th hin cc nh l hay qui tc suy din trn cc lo i s kin khc nhau. V d : Mt tam gic ABC c 2 cnh AB v AC bng nhau th tam giac l tam gic cn ti A. Vi 3 on thng a, b v c, n u a // b v a c th ta c b c. 1.4.2 T chc c s tri thc COKB C s tri thc COKB c th c t chc bi mt h thng tp tin vn bn c cu trc nh sau: Tp tin Objects.txt lu tr cc nh danh cho cc lo i i tng C-Object. Tp tin RELATIONS.txt lu tr thng tin v cc loi quan h khc nhau trn cc lo i C-Object. Tp tin Hierarchy.txt lu li cc biu Hasse th hin quan h phn cp trn cc khi nim. Cc tp tin vi tn tp tin lu tr cc cu trc ca lo i i tng. Tp tin Operators.txt lu tr cc thng tin v cc ton t trn cc i tng. Tp tin FACTS.txt lu tr thng tin v cc loi s kin khc nhau. Tp tin RULES.txt lu h lut ca c s tri thc.
10
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Biu phn cp khi nim
Cc loi i tng
Cu trc i tng
...
Cc quan
Cu trc i tng
Hnh 1.2 : bi u lin h gia cc thnh ph n trong m hnh COKB Do cch t chc tri thc trong m hnh COKB r rng v rnh mch vi y cc thng tin cng vi cc lin h khc nhau rt a dng. V cng chnh v th ta ph i phn tch u vo rnh mch ging nh cc thnh phn trong m hnh c s tri thc quy nh. Do bi ton s c quy nh vi cu trc c bit c gi l ngn ng c t bi ton. Ta i vo xem xt ngn ng c t bi ton ca hai h gii ton t ng: gii ton m t CObject v gii bi ton hnh h c phng. 1.5. Bi ton gii ton mt C-Object Ho t ng ca chng trnh gii ton C-Object da trn c s tri thc cc C-Object c t chc theo m hnh COKB Phn tch Gi thit: A Kt lun: B
Gii
Dch v tri th c
Li gii
Tri thc
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB a u vo cho chng trnh gii ton C-Object da trn c s tri thc cc CObject c t ch c theo m hnh COKB th cu trc ca m t bi ton c dng nh sau : begin_hypothesis parameters: objects: <cc i tng> facts: <cc s kin> ... end_hypothesis begin_goal <m c tiu c a bi ton> end_goal Cu trc bi ton ny s c ngi dng phn tch v a vo cho h v h gii ton s da vo mt s th t c chnh phn tch bi v tm li gii. 1.6. Bi ton hnh hc phng u vo c a h ny cng cn m t ngn ng c t cho bi ton: bi ton c khai bo theo cu trc sau: begin_hypothesis parameters: objects: <cc i tng> facts: <cc s kin> ... end_hypothesis begin_goal <m c tiu c a bi ton> end_goal : <kiu i tng> <cc tham bin> : <kiu i tng> <cc tham bin>
12
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cng vic a ra ngn ng c t cho bi ton cng phi c ngi s dng t a ra theo mu quy nh m cha c h thng no lm t ng thay cho vic ny. 1.7. V d bi ton theo ngn ng t nhin: Cho tam gic ABC, cn ti A, v cho bit trc gc nh A b ng , cnh y a bng m. Bn ngoi tam gic c hai hnh vung ABDE v ACFG. Tnh di EG. c t bi ton: begin_hypothesis parameters: objects: O1 O2 O3 O4 facts: O1.GOC[C, A, B]; O1.DOAN[B, C]; O1.A = Pi O2.A end_hypothesis begin_goal determine: end_goal O2.DOAN[E, G]; : : : : TAM_GIAC[A, B, C]; TAM_GIAC[A, G, E]; HINH_VUONG[A, E, D, B]; HINH_VUONG[A, C, F, G]; A, B, C, D, E, F, G: DIEM;
2. V n cn tn ti trong bi ton
Bi ton trn a ra m hnh biu din tri thc kh tt ph c v cho gii bi ton mt cch t ng, tuy nhin d liu u vo ca h khng phi l bi ton theo ngn ng t nhin m l theo mt nh dng cho trc, m t ngn ng c t bi ton. V th , vn gp ph i bi ton ny l khi ta mu n gii mt bi ton th trc ht chng ta ph i lm mt cch th cng a ra dng c t ca chng ri m i a vo h gii. iu
13
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB lm cho d liu u vo ca h gii ton khng c t nhin v gy kh khn cho ngi s dng.
14
PHN 2: C S L THUYT
1. Tm hiu v ngn ng t nhin
Trc h t ta cn phn bit thut ng ngn ng t nhin ( Natural Language), nh ting Vit, tin Anh, ting Php, ting Ngavi ngn ng nhn to (Artificial Language), nh: ngn ng my tnh (C, Pascal, C#...). C khong 5600 ngn ng trn th gii, c phn b khng ng u , c ngn ng c hng trm triu ngi s dng nh : Quan Thoi, Anh, Ty Ban Nha, Nga, Php ting Vit ng hng th 20, nhng ch c ngn ng c vi chc ngi s dng (ch yu l ngn ng ca cc b tc t ngi v hin nay cc loi ngn ng ny ang dn b mt i). Trong s 5600 ngn ng , ch c mt s t cc ngn ng l c ch vit. 1.1. nh ngha Cng nh cc phm tr khc, ngn ng cng vy c rt nhiu khi nim, sau y chng ta s tm hiu m t s khi nim v ngn ng: Ngn ng : l m t h thng nhng n v vt cht v nhng quy tc hot ng ca chng, dng lm cng c giao tip ca con ngi, c ph n nh trong thc cng ng tru tng khi bt k mt t tng, cm xc v c mun c th no. Ngn ng : l h thng tn hiu quan trng v c o nht trong giao tip ca loi ngi; l phng tin biu hin v pht trin t duy, bo lu v chuyn giao c hiu l c nht cc truyn thng lch s - vn ho ca mt dn t c. Ngn ng l mt loi h thng tn hiu bao gm mt hnh thc v m t ni dung. Ngn ng l m thanh c ngha v h thng m loi ngi dng lin lc, cm thng v din t t tng vi nhau. Ngn ng t nhin l ngn ng s dng hng ngy trong giao tip, c th l ting Anh, Php, Nht, Vit,N c th lu tr li trn my tnh di dng vn bn, email,hoc thu m li ging ni.
15
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Tm li, ngn ng c th c hiu l h thng nhng m, nhng t v nhng quy tc kt hp chng m nhng ngi trong cng m t cng ng dng lm phng tin giao tip vi nhau. 1.2. Bn cht ca ngn ng Ngn ng l mt hin tng x hi: khng l hin tng t nhin, c nhn, sinh vt (di truyn) v l hin tng x hi c bit. Ngn ng l phng tin giao tip quan trng nht ca con ngi : cc phng tin khc c din gii qua ngn ng. Ngn ng l hin tng trc tip ca t tng: ngn ng l phng tin ca t duy. Quan h ngn ng - t duy ( thc) hin thc tng ng vi quan h t - khi nim s vt. Ngn ng l mt h thng tn hiu n c bn cht tn hiu: ging nh tn hiu c hai mt: m t biu hin vt cht (m, ch ) v mt c biu hin (ngh a). Hai mt ci biu hin v ci c biu hin ca tn hiu ngn ng c quan h gn b vi nhau nh hai mt ca m t t giy, nhng hai mt li c quan h v on vi nhau, ngha l quan h m khng gii thch c l do, quan h ch do quy c, thoi quen c a cng ng. V y ngn ng l h thng k hiu c bit dng lm phng tin giao tip quan trng nh t ca con ngi. 1.3. Tnh h thng ca ngn ng
Cc cp trong ngn ng
Theo trnh t nh n ln, c th k ra cc n v c a ngn ng l: m v, hnh v, t, ng, cu v vn bn. m v: n v m thanh nh nht cu to v khu bit v mt biu hin vt ch t (m thanh) ca cc n v khc. Hnh v: n v nh nh t mang ngh a c cu to bi cc m v. T: n v mang ngh a c lp, c cu to bi hnh v, c chc nng nh danh. Ng: gm hai hay nhiu t c quan h ng php hay ng ngha vi nhau.
GVHD: PGS.TS. VN NHN 16 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cu: gm cc t/ng c quan h ng php hay ng ngh a vi nhau v c chc nng c b n l thng bo. Vn bn: h thng cc cu lin kt vi nhau v mt hnh thc, ng php, ng ngha v ng dng.
17
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Ng ngh a: m i quan h gia n v ngn ng vi ni dung (v m t ngha) ca n v . Ng dng : m i quan h gia n v ngn ng vi m c ch s dng ca n v . 1.4. c im ca ngn ng t nhin ting Vit v Ting Anh
c im ca ting Anh
Ting Anh c xp vo loi hnh bin cch hay cn gi l loi hnh khut chit vi nhng c im chnh nh sau : Trong hot ng ngn ng, t c bin i hnh thi. ngha ng php nm trong t . Hin tng cu to t bng cch ghp thm ph t vo gc t rt ph bin. Kt hp gia cc hnh v l cht ch . Ranh gii gia cc hnh v l kh xc nh. Ranh gii t c nhn din bng khong trng ho c du cu.
c im ca ting Vit
Ting vit c xp vo lo i hnh n lp hay cn gi l lo i hnh phi hnh thi, khng bin hnh, n tit vi nhng c im chnh nh sau : Trong hot ng ngn ng, t khng bin i hnh thi. ngha ng php nm ngoi t . Phng thc ng php ch yu l: trt t t v t h. Tn ti m t loi n v c bit, l h nh tit m ng m ca chng trng kht vi m tit, v n v cng chnh l hnh v ting vit hay cn gi ting. Ranh gii t khng c xc nh mc nhin bng khong trng nh cc ting bin hnh khc. iu ny khin cho vic phn bit hnh thi ting vit tr nn kh khn. Vic nh n din ranh gii t l quan trng lm tin cho cc x l tip theo sau nh: kim tra li chnh t, gn nhn t loi, thng k tn sut t ,.. Tn ti loi t c bit t ch loi hay cn g i l ph danh t ch lo i danh t i km vi danh t.
GVHD: PGS.TS. VN NHN 18 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB V mt ng m hc, cc m tit ting vit u mang mt trong 6 m iu : ngang, sc, huyn, hi, ng, nng. y l m v siu on tnh. Ting vit cn hin tng ly nh: lp lnh, lung linh
Ranh gii t
19
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB 2.2. Mt s h dch my n nay trn th gii c nhiu nhm/cng ty d ch my khc nhau: nhm SYSTRAN c a M, CETA Php... nhng ni ting v hiu qu nht l h dch Anh Php METO chuyn dch cc b n tin d bo thi tit Canada. Nam , c d n Nghin cu v trin khai h dch a ngn ng gi a Nht v cc nc Chu . Trong nhng nm gn y Nht l nc u t nhiu nht vo nhng h dch thng mi (trn my tnh c nhn PC v my cm tay PDA) d ch Nht Anh... Ti Vit Nam, cng c nhiu ti nghin cu, phn m m thc hin vic dch t ng t Anh sang Vit nh h dch ti liu Tin Hc EVT ca khoa CNTT, trng H Khoa H c T Nhin H Quc Gia TPHCM (GS.Hong Kim TS.inh in), ti dch my ca khoa CNTT, trng H Bch Khoa H Qu c Gia TPHCM (PGS.Phan Th Ti), ph n mm d ch Anh Vit EVTRAN ca Vin Cng Ngh vi in t (TS.L Khnh Hng), trang Web dch Anh Vit, Php Vit ca TS.on Nguyn Hi... Thm ch cn c nhm nghin cu kt hp vi b nhn dng v tng hp ting ni thc hin robot phin d ch ting ni ging nh ngi tht (h MOBIL). Nhn chung tt c cc h dch trn cng ch dng ch dch t ting nc ny sang ting nc khc thi: Anh Vit, Anh Php, Vit Anh,... nhng cha c h dch no l dch t ng no dch t ngn ng t nhin sang ngn ng c t ca bi ton lm u vo cho cc h gii ton t ng m nhng c t phi do con ngi lm bng tay. Trong ti ny, em s s dng kt qu ca x l ngn ng t nhin ng dng vo h dch t ng, nhng khng phi xy d ng ph n mm d ch t ting nc ny sang ting nc khc m l xy dng ph n mm dch t ngn ng t nhin sang ngn ng c t lm u vo cho cc h gii ton t ng. 2.3. Cc bi ton trong dch my thc hin vic dch vn bn ta cn ph i gii quyt m t s bi ton chnh nh sau: Tin x l: tch cu, tch on.. Phn tch hnh thi ngn ng : tch t nhn din tn ring, t vit tt.
20
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Phn tch t php ngn ng ngun: gn nhn t loi Phn tch c php ngn ng ngun: xy dng cy c php, quan h ng php. Phn tch ng ngh a ngn ng ngun: gn nhn ng ngha cho cc t trong cu. Chuyn i cy c php t ngn ng ngun sang ngn ng ch. Hnh thnh cu ca ngn ng ch t cy c php ngn ng ch.
Tin x l
Khi u vo ca h thng l mt on vn bn ta phi tin hnh x l s b vn bn u vo r i phn tch chng thnh cc n v r rng cho h thng chnh d x l. Bi ton tin x l s bao gm cc bc sau: Trc h t x l s b vn bn u vo l lm sch vn bn bng cch xa b nh ng k t , nhng vng khng cn thit cho h th ng. Mi on vn bn u vo s c b phn tin x l nh n din ra cc ch thch, tiu , on vn trong vn bn s th t v gch u dng. Giai on quan trng v trng tm nht c a tin x l l phn tch on vn thnh cc cu. V hn na l tch cc cu thnh cc m nh gim tnh ph c tp cho h thng cng nh cht lng v tc x l ca h thng. Giai o n x l s b on vn b n: u tin on vn bn u vo s c b ph n tin x l nh n din cc k t c bit, cc nh d ng ca vn bn sau xa b chng hoc thay th b ng k t nh dng ring do h thng quy nh hoc lu li thng tin ca chng. Sau vn bn gc s c a v dng theo quy nh c a h thng. Da vo cc nh dng ring ca h thng th vic x l s d dng hn. Giai on tch vn bn thnh on: Do s a dng v trnh by v nh dng vn bn ca ngi dng c bit l trong vn bn dng text. Do , y l mt vn kh khn trong x l tch vn bn thnh tng on y l mt kh khn rt ln cho h tin x l v khng th lng trc c ht tt c kh nng nh dng ca ngi dng.
21
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Ngoi ra trong cc on vn text thng thng cng c nhiu cch trnh by khc nhau. VD: on vn c th tht vo dng u tin, c th v a tht dng u tin v tht dng c cc dng cn li; u vn bn c th nh s 1, 2, 3,...; A, B, C, I, II, III,... Cng do s a dng trong cch trnh by vn bn nh vy, vic phn tch kt cu ca vn bn phn tch on gp nhiu kh khn v vic a ra nhng thng tin chnh xc v v tr c a cu cho h dch ch c th t c m t kt qu tng i. gim bt phc tp bi ton gp phi ta cn a ra quy c trnh by vn bn nh sau: Do s a dng trong cch trnh by vn bn cn d ch, m c s ca tin x l li da trn cch trnh by nn cn phi c mt quy cch trnh by chun, theo phn h tin x l c th phn bit cc thnh phn trong vn bn. Quy cch ny cng cn phi c s dng rng ri v tng i linh ho t c th ph h p vi mt lng ln cc vn bn cn d ch. V vy, quy cch trnh by c ngh d a trn cch trnh by vn bn ting Anh thng thng, c s dng nhiu trong cc vn bn hnh chnh, sch bo, cc ti liu in t... y ch l mt cch trnh by ph bin c s dng nhiu nn khng th bao ht tt c cc cch trnh by khc nhau c th c. Tuy nhin cch trnh by ny da trn nhng c im chung nht ca vn bn ting Anh c gng trnh nh m ln khi x l cc lo i vn bn kiu khc chu n. Ngoi ra, vic tch on cn ch n du hiu bt u on nh: vit hoa u dng, tht u dng...v d u hiu kt thc on nh du ch m cu... Tch cu: Trong mt on vn bn ting Anh hay a s cc ngn ng thng dng khc, thng thng th ngi ta dng du chm (.), chm than (!), ch m hi (?) v m t s su khc n a nhn bit kt thc cu. Ta gi nhng du ny l nh ng du bo hiu kt thc cu hay du chm cu. Tuy nhin do tnh nh p nhng c a d u bo hiu kt thc cu, nn vic xc nh ranh gii cu khng cn n gin nh chng ta ngh.
GVHD: PGS.TS. VN NHN 22 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB VD: du chm, c th biu th nh mt d u ch m thp phn, m t cm t vit tt, s kt thc cu vn hoc ngay c t vit tt nm cui cu vn. Mt du chm hi hay d u ch m than c th xu t hin trong d u ngoc n, ngoc kp hay cng nh cui cu. nh n din du chm cu, ngi ta c th dng cc heuristics ho c cc m hnh hc ph c tp hn: mng neural, ...
23
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Bi ton nhn din tn ring c lin h cht ch vi bi ton nh n din d u ch m cu. V khi ta bit d u ch m l thnh phn thuc tn ring trong cc trng hp: Dr., TS.,... th ta suy ra ngay du chm khng phi l du chm cu. Vic nhn din tn ring rt cn thit trong vic phn tch vn bn gn nhn t loi, phn tch c php, phn tch ng ngha, dch t ng, tm tt vn bn, hiu vn bn,... Nhn din ranh gii t: Nh n din ranh gii t (word boundary identification) hay cn gi l phn on t (word segmentation) l mt cng on tin quyt i vi hu h t cc h x l ngn ng t nhin. i vi cc ngn ng bin hnh (ting Anh, ting Nga,...) th ranh gii t c xc nh ch yu bng khong trng hay du cu, cn i vi cc ngn ng n lp (ting Vit, ting Hoa, ting Thi,...) th khong trng khng phi l tiu ch nhn din t. Mun xc nh c ranh gii t trong cc ngn ng ny, chng ta phi d a vo cc thng tin m c cao hn, nhu h nh thi, t php, c php, ho c ng ngha hoc v th m ch c ng dng. Trong bi ton tch t, chng ta cn ph i n m vng cc tiu ch ranh gii t ting Vit c xy d ng da trn c s ngn ng hc. Tht vy, ta phi bit: xe p, cun sch, v sao, tm ra,... c ph i l t hay khng t mi a cho my cch nhn din t mt cch t ng. nh n din ranh gii t, ngi ta s dng mt s m hnh nh: MM (Maximum Matching: forward / backward hay cn gi LRMM: Left Right)... Theo phng php LRMM, phn on t ting Vit trong m t ng/cu , ta i t tri sang phi v chn t c nhiu m nht m c m t trong t in, r i c tip tc cho t k tip cho n h t cu. Vi cch ny, ta d dng tch chnh xc cc ng/cu nh: nhn dn | Vit Nam | anh hng; thnh lp | nc | Vit Nam | dn ch | cng ha,... Tuy nhin phng php ny s tch t sai trong cc trng h p: h c sinh | hc sinh | hc, mt | ng | quan ti | gii,... C nhiu cch gii quyt vn ny, nhng phng php WFST c a Richard W. Sproat c xem l phng php hiu qu nht v chnh xc ca n n 95% khi p dng cho ting Hoa. Nhng khi h a ra nhiu kt qu c chnh xc xp x nh nhau
24
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB th vic chn li gii ti u l mt vn kh khn. Cc tc gi Hong Kim, inh in a ra cch gii quyt cho vn ny l kt hp m ng neural ti u bi ton ny.
25
I S-V
enter V-O
an D-N
old
A-N
bank
Hnh 2.1 cc quan h ng php Gn nhn cy c php: gn nhn cy c php hay cn g i l phn tch c php l nhm phn tch mt cu thnh nh ng thnh phn vn phm c lin quan vi nhau v c th hin thnh cy c php. Khi nhp cu, ta ph i phn thnh cc thnh ph n nh: ch ng, v ng; gn vai tr ch t/i t ca ng t chnh, b ngha,... V d: nhp cu I enter the bank, n s phn tch thnh dng nh sau: [I]NP [enterV [anDet oldAdj bankN]NP]VP v cy c php tng ng: S NP V VP NP
enter
the bank
Hnh 2.2: cy c php c a cy I enter the bank phn tch c php, ta c th dng cch tip cn d a trn lut (rule-based) hoc d a trn thng k t kho ng liu (corpus): Vi cch tip cn da trn lut, ta cn c b lut vn phm v gii thut phn tch c php. Vi cch tip cn d a trn th ng k, chng ta cn c kho ng liu m trong cc cu c phn tch c php chnh xc (ch ng hn nh ng liu PennTreeBank, SUSANNE cho ting Anh). H thng hc t kho ng liu rt ra quy lut gn nhn cy c php cho cu mi bng nhng phng php nh: Maximum Entropy, thng k,
26
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB im kh khn nht trong vic phn tch c php l cch chn cy c php ti u. Vi mt cu thng n to ra nhiu cy c php khc nhau, khin ta khng bit chn kt qu no cho ng.
NP
NP
Det
Adj
N1
N0
Det
N0
N1
Adj
new
computer system
mt
h thng my tnh
m i
27
1. M t bi ton cn x l
Bi ton c cp v nghin cu trong ti ny l dch t ngn ng t nhin sang ngn ng c t nh m phc v u vo cho h gii ton thng minh. u vo ca bi ton ny l mt bi ton dng ngn ng t nhin ting Vit (ngn ng ngun), quy trnh x l lm sao chuyn bi ton ny sang d ng tin c t v sau l ngn ng c t (ngn ng ch) cui cng l lu kt qu ny vo file Dacta.xml. M hnh bi ton c biu din nh hnh 4.1: bi ton
CSDL mu cu
Mu cu vi c t
mu cu vi c t
B lm sau c t Dacta.xm l
Ngn ng c t
Hnh 3.1: m hnh bi ton chuyn t ngn ng t nhin sang ngn ng c t Bi ton ny c ng dng lm u vo cho h gii ton t ng trong lnh vc ton hc.
GVHD: PGS.TS. VN NHN 28 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Trong khi cc h gii ton thng minh c th t ng gii mt bi ton nhng u vo ca n khng c t nhin m l mt bi ton c a v dng ngn ng c t quy nh cho h gii v bi ton c a v dng c t th c lm th cng bng tay, v d nh h gii ton thng minh gii mt bi ton hnh h c phng ca TS. vn Nhn m ta kh o st ph n 2. V y vn m bi ton t ra l lm sao gip u vo ca cc h gii ton thng minh c t nhin hn. Vic chuyn t mt bi ton t ngn ng t nhin sang dng ngn ng c t ca bi ton s c lm mt cch t ng. lm c iu ny ta phi da trn b t in c ng ngha c xy d ng ng dng trong lnh vc ton hc v kt qu c a h thng x l ngn ng t nhin: tch t, tch cu a ra dng m u cu theo t loi. Bi ton t ra yu cu nh sau: Input: mt bi ton Output: ngn ng c t ca bi ton
gii quyt yu cu ca bi ton ta cn thc hin cc bc ln sau: Bc 1: c file XML c s d liu mu cu (CSDL mu cu) cho trc ly tng dng mu cu a chng v ngn ng tin c t Bc 2: chuyn on vn t ngn ng t nhin sang ngn ng c t theo nh ngh a cho trc. Bc 3: t dng tin c t a on vn bn thnh dng c t chi tit output.
29
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB 2.1. Quy c chung cho bi ton gii quyt ba bc nu trn ta cn a ra quy c chung cho bi ton. Vn t ra y l lm sao c mt cu m a ra c d ng c t ca chng, quan trng l do ngha c a t. V vy em phn ra thnh 5 dng t c m t nh sau: i tng: Tn i tng Ngha i tng Tham s chnh Thu c tnh ca i tng
V d: cho A l mt im im tn i tng l DIEM Ngh a ca i tng l im Tham s chnh A l k t Cc thuc tnh Ho c cho tam gic ABC. Tam gic tn i tng l TAM_GIAC Ngh a ca i tng l tam gic Tham s chnh: c 3 k t A, B, C Cc thuc tnh: nh, gc, cnh,... Nhn chung cc i tng thng l nh ng danh t. c im: c im thng xut hin ba loi t: ng t, danh t v tnh t. c im th thuc v i tng. V d: c im thuc v im Cho M l trung im on AB. Cho B l im no n m ngoi tam gic HEK. Hay c im thu c v ng/on thng
GVHD: PGS.TS. VN NHN 30 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cho BC l phn gic gc ABD c im gm c c im mt ngi, hai ngi, ba ngi v nhiu ngi V d: Cho AK l phn gic gc BAC -> c im 1 ngi Cho gc ABC k b vi gc BCD -> c im hai ngi Cho ng th ng AB vung gc vi ng th ng TD ti M -> c im 3 ngi. Cho ng th ng TD, GH, KE ct nhau ti im M -> c im nhiu ngi. Thng thng c im thng xut hin vi cc t l, vi, ca hay ti. Thu c tnh: l cc c trng ca i tng thuc v bn cht ca i tng V d: tn ca i tng, s o ca i tng, chiu di ca i tng. Thng thng thuc tnh thng xut hin chung vi t c a Tnh cht: T thng dng: b ng, = V d: cho tam gic ABC = tam gic HEK. Cnh BC = 5 cm. Yu cu thc hin: thng l cc t: chng minh rng, tnh, so snh, tm... V d : cho tam gic ABC = tam gic HEK trong AB = 2 cm, gc B = 40, BC = 4 cm. Tnh gc HEK, on HE. c t bi ton: begin_exercise begin_problem cho tam gic ABC = tam gic HEK trong AB = 2 cm, gc B = 40, BC = 4 cm. Tnh gc HEK, on HE. end_problem begin_hypothesis [{},{[A,DIEM],[B,DIEM],[C,DIEM],[TAM_GIAC[A,B,C],TAMGIAC],[H, DIEM],[E,DIEM],[K,DIEM],[TAM_GIAC[H,E,K],TAMGIAC]},{TAM_GI
31
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB AC[A,B,C]=TAM_GIAC[H,E,K],DOAN[A,B].a=2,GOC[A,B,C].a=40,DOAN[B,C]. a=4}] end_hypothesis
end_exercise Trong c t ny c: i tng: tam gic, im, on, gc. c im {} Thuc tnh: nh, on thuc tam gic. S o cnh, s o gc Tnh ch t D kin: hai tam gic bng nhau: tam gic ABC = tam gic HEK S o cnh AB = 2, gc ABC = 40, cnh BC = 4 Yu cu tnh ton: tnh on HE v gc HEK.
2.2. M hnh c t tng qut T nhng quy c trn ta a ra dng c t chung v tng qut cho cc thnh ph n chnh trong m u cu nh nu mc 4.2.1. Theo TS. Vn Nhn c m t s cch m t nh sau: - i tng: [<object >,<loi object>] - i tng v thuc tnh: <object>,<object>.<thuc tnh> - i tng v biu thc hng: <object> = <biu thc hng> Trng hp i tng ch c mt thuc tnh nh on th s c m t nh sau: <object>.<thu c tnh> = <biu th c h ng> - i tng v thuc tnh = i tng v thuc tnh: <object>|<object>.<thuc tnh> = <object>|<object>.<thu c tnh>
GVHD: PGS.TS. VN NHN 32 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB - i tng v thuc tnh = biu thc theo cc i tng hay thuc tnh khc: <object>|<object>.<thuc tnh> = < biu th c theo cc i tng hay thuc tnh khc > - c im v i tng lin quan: [<tn quan h>, dy 2 i tng cho quan h hai ngi] Trng hp quan h c tnh i xng c m t di dng: [<tn quan h>, {hai i tng c quan h (c th l nhiu i tng)}] Trng hp quan h c tnh i xng v tnh truyn [<tn quan h>, {ba i tng c quan h tr ln}] D a vo m t trn em a ra m t s m hnh ring cho mnh bi ton d gii quyt hn :
33
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB DOAN[A, B]. di = 5 DOAN[A, B].a = 5
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Din tch tam gic ABC = 5 cm2 TAM_GIAC[A, B, C].din tch = 5 TAM_GIAC[A, B, C].S = 5
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB <Cau>........</Cau> </Maucau> </dataroot> V d: <dataroot> <Maucau> <Cau>cho|ten|l|dacdiem|doituong|ten</Cau> </Maucau> <Maucau> <Cau>cho|doituong|ten</Cau> </Maucau> <Maucau> <Cau>cho|doituong|ten|l|doituong</Cau> </Maucau> ..... </dataroot> C hai d ng m u cu: mu cu gi thit v mu cu kt lu n. Mu cu gi thit l cc m u cu nu ln cc i tng, s kin lin quan thng bt u vi cc t: cho, bit... hoc b t u bng mt i tng: V d: cho tam gic ABC -> cho|i tng|tn t m u cu trn ta a ra dng tin c t nh sau: cho|[tn, i tng] cho ABC l tam gic -> cho|tn|l|i tng Cho|[tn,i tng] cho tam gic ABC, cnh AB = 5 cm, cnh BC = 10 cm. Cho|i tng|tn|i tng|tn|tnh cht|s lng|i tng|tn|tnh cht|s lng.
GVHD: PGS.TS. VN NHN 36 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Cho|[tn,i tng]|[tn,i tng]|tnh cht|s lng|[tn,i tng]|tnh cht|s lng. Mu cu kt lun l cc mu cu a ra cc yu cu ca bi ton thng b t u bng cc t: tnh, so snh, chng minh, tm,... v chng s c a v c t ring cho m u cu kt lun V d: Tnh chu vi tam gic ABC Tnh|thuc tnh|i tng|tn Tin c t s c dng: [Tnh, [tn,i tng].thu c tnh] Tm s o gc ABC Tm|thuc tnh|ca|i tng|tn Tin c t s c dng: [Tm,[tn,i tng].thuc tnh] Thut ton s b nh sau: B1: c file XML CSDL mu cu ly tng lo i m u cu. B2: Kim tra mu cu n u l mu cu kt lu n nhy n B4 B3: Gn tin c t bt u nh ngha theo mu cu gi thit nhy n B5 B4: Gn tin c t bt u nh ngha theo mu cu kt lun B5: duyt m u cu theo t loi a v d ng tin c t nh ngh a mc B6: lu mu cu vi c t vo file XML B7: Quay li B1 khi cn m u cu.
37
Ly tng mu cu
CSDL mu cu
Kt lun
Mu cu vi tin c t
Hnh 3 .2 s gi i thu t chuyn mu cu thnh d ng tin c t . File mu cu vi c t c thit k nh sau: <dataroot> <Maucau> <Cau>........</Cau> <Tdacta>........</Tdacta> </Maucau> </dataroot>
38
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB V d: <dataroot> <Maucau> <Cau>cho|doituong|ten</Cau> <Tdacta>cho|[ten, doituong]</Tdacta> </Maucau> <Maucau> <Cau>tnh|thuoctinh|cua|doituong|ten</Cau> <Tdacta>[tnh,[ten, doituong].thuoctinh]</Tdacta> </Maucau> ... </dataroot> 2.4. Chuyn vn bn t ngn ng t nhin sang dng ngn ng tin c t cho bi ton gim i ph c tp khi chuyn t ngn ng t nhin sang ngn ng c t ta cn qua bc trung gian l chuyn vn bn u vo v d ng ngn ng tin c t, ri ly kt qu t tin c t chuyn qua c t. Trc ht ta s xem cc v d a ra thut ton gii quyt vn : V d 1: cho tam gic ABC. Cnh AB = 5 cm, cnh BC = 10 cm, cnh AC = 8 cm. Tnh chu vi tam gic ABC. Trc ht ta cn tch on vn bn ra thnh tng cu ring bit v chuyn chng v dng mu cu vi cc thnh phn chnh: Cho tam gic ABC cho|i tng|tn tin c t: cho|[tn, i tng]
- Cnh AB = 5 cm, cnh BC = 10 cm, cnh AC = 8 cm. i tng|tn|tnh cht|s lng| i tng|tn|tnh ch t|s lng| i tng|tn|tnh cht|s lng| Tin c t: tng]=s lng - Tnh chu vi tam gic ABC Tnh|thuc tnh|i tng|tn Tin c t: [Tnh,[tn,i tng].thu c tnh] [tn,i tng]=s lng|[tn,i tng]=s lng|[tn,i
39
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Sau khi a v dng mu cu vi cc i tng chnh ta s tch cu thnh tng t v a chng v d ng tin c t ca tng lo i m u cu theo nh ngh a trc. - Cho|tam gic|ABC Cho|[ABC,tam gic] - Cnh|AB|=|5|Cnh|BC|=|10|Cnh|AC|=|8 [AB,cnh]=5|[BC,cnh]=10|[AC,cnh]=8 - Tnh|chu vi|tam gic|ABC [Tnh,[ABC,tam gic].chuvi] V d 2: cho im M l trung im on BC. on BC = 5 cm. Ch ng minh on BM v on MC bng nhau. Cho im M l trung im on BC
Cho|i tng|tn|l|c im|i tng|tn Tin c t: Cho|[tn,i tng],[tn,i tng]|[c im, tn, tn] on BC = 5 cm i tng| tn|tnh cht|s lng Tin c t: [tn,i tng]=s lng Ch ng minh on BM v on MC bng nhau chng minh|i tng|tn|v|i tng|tn|tnh cht Tin c t: [Chng minh,[tnh cht, tn, tn]] on vn bn vi ngn ng tin c t: Cho|im|M|l|trung im|on|BC
[ch ng minh,[b ng nhau, BM, MC]] T cc v d trn ta a ra thut ton nh sau: B1: tch on vn thnh tng cu ring bit B2: tch cu thnh tng t ring bit B3: duyt tng cu chuyn thnh dng mu cu theo t loi
40
B5: duyt m u tin c t ly t theo t loi tng ng. B6: ngn ng tin c t bi ton.
bi ton
tch t v gn nhn t lo i
Tin c t tng ng vi mu cu
Mu cu v tin c t
Ngn ng tin c t bi ton Hnh 4.3: s gi i thu t chuy n ngn ng t nhin sang ngn ng tin c t . 3.2.5. Chuyn t ngn ng tin c t sang ngn ng c t bi ton y l ch n cu i cng c a bi ton dch t ngn ng t nhin sang ngn ng c t. Sau khi chuyn t ngn ng tin c t sang ngn ng c t ta s lu vo file dacta.xml c cu trc nh sau <exsercise> <problem> bi ton </problem>
41
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB <hypothesis> gi thit bi ton cho </hypothesis> <goal> Yu cu bi ton (kt lun) </goal> </exsercise > Trc ht ta s xem xt cc v d sau: V d 1: cho tam gic ABC, cnh AB = cnh BC = 5 cm, gc BAC = 600. Tm di cnh AC v chu vi tam gic ABC. Qua cc bc 4.2.3 v 4.2 .4 ta c ngn ng tin c t nh sau: cho|[ABC,tam gic]|[AB,cnh]=[BC,cnh]=5|[BAC,gc]=60|[[tnh,
[AC,cnh].a], [tnh, [ABC,tam gic].chu vi]] t ngn ng tin c t trn ta ph i chuyn sang ngn ng c t nh sau: gi thit: [{},{[A,DIEM], [B,DIEM], [C,DIEM],[TAM_GIAC[A,B,C],
TAM_GIAC]},{DOAN[A,B].a=DOAN[B,C].a=5,GOC[B,A,C].a=60}] kt lun: [[Tnh,DOAN[A,C].a],[Tnh,TAM_GIAC[A,B,C].C]] kt qu c t c lu tr vo file dacta.xml nh sau: <exsercise> <problem> cho tam gic ABC, cnh AB = cnh BC = 5 cm, gc BAC = 600. Tm di cnh AC v chu vi tam gic ABC. </problem> <hypothesis> [{},{[A,DIEM],[B,DIEM],[C,DIEM],[TAM_GIAC[A,B,C],TAM_GIA C]},{DOAN[A,B].a=DOAN[B,C].a=5,GOC[B,A,C].a=60}] </hypothesis> <goal> [[Tnh,DOAN[A,C].a],[Tnh,TAM_GIAC[A,B,C].C]]
GVHD: PGS.TS. VN NHN 42 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB </goal> </exsercise > V d 2: V gc ABC c s o bng 560. V gc ABC k b vi gc ABC. Hi s o c a gc ABC? Ngn ng tin c t bi ton: V|[ABC, gc].a=56|v|[ABC, gc],[k b, ABC, BAC] | [h i, [ABC, gc].a ] Ngn ng c t: Gi thit: [{},{[A,DIEM],[B,DIEM],[C,DIEM],[C,DIEM]},{GOC[A,B,C].a=56,[KE BU, GOC[A,B,C],GOC[A,B,C]]}] Kt lu n: [[Hi,GOC[A,B,C].a]] kt qu c t c lu tr vo file Dacta.xml nh sau: <exsercise> <problem> V gc ABC c s o bng 560. V gc ABC k b vi gc ABC. H i s o ca gc ABC? </problem> <hypothesis> [{},{[A,DIEM],[B,DIEM],[C,DIEM],[C,DIEM]},{GOC[A,B,C].a=56, [KEBU, GOC[A,B,C],GOC[A,B,C]]}] </hypothesis> <goal> [[Hi,GOC[A,B,C].a]] </goal>
GVHD: PGS.TS. VN NHN 43 HVTH: L NHT TRNG CH1101150
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB </exsercise > T hai v d trn ta a ra thut ton s b nh sau: B1: tch chu i tin c t ra thnh tng t ti cc k hiu c bit trong chui B2: duyt tng t trong chui tin c t. B3: nh ngh a cc bin lin quan cu thnh i tng. B4: nh ngh a i tng theo dng c t B5: nh ngh a cc s kin ca bi ton B6: nh ngh a cc yu cu ca bi ton B7: duyt n ht chui tin c t ta c cc d kin lin quan ca bi ton theo ngn ng c t lu vo file Dacta.xml Chui tin c t Tch chui thnh
Duyt tng t
nh ngha i
nh ngha cc s
Chui c t
44
3. Thit k v ci t bi ton
3.1. Thit k giao din Phn mm c thit k trn giao din Window Form bao gm mt form chnh v m t form ph.
Form ph dng load t in c ng ngha c nghin cu v xy dng phc v cho bi ton ny. Form chnh c thit k bao gm: mt hp textbox dng nhp vn bn u vo, m t textbox ch c c xut vn bn u ra, v bn nt lnh vi cc chc nng: xem t in, a vn bn v dng tin c t, c t, v thot chng trnh.
45
46
47
Hnh 3.7: mn hnh khi ch n nt c t Tip theo bn chn OK, kt qu ngn ng c t s hin th trong hp textbox on vn sau khi tch nh hnh 3.8:
Nghin cu xy d ng h thng dch t ngn ng t nhin sang ngn ng c t vi m hnh COKB Sau khi th c hin c t xong, ta cng c th m file Dacta.xml xem kt qu c lu tr nh th no.
3.3. Cng ngh s dng Phn m n xy d ng trn nn .Net, ngn ng s dng ci t l Visual C# theo hng i tng. Bn cnh phn m m cn s dng cng ngh XML lu tr v truy xut d liu. 3.4. Nhn xt Trong thi gian nghin cu, ti xy d ng c h thng dch t ngn ng t nhin sang ngn ng c t vi cc chc nng nh: dch vn bn t ngn ng t nhin sang ngn ng tin c t, dch vn bn t ngn ng t nhin sang ngn ng c t. H thng c ci t v th nghim t c kt qu sau: u im: h thng bc u thc hin c vic dch ngn ng t nhin sang ngn ng c t ng d ng trong bi ton hnh hc v t c kt qu kh quan p ng c yu cu t ra ca ti. Khuyt im: tuy nhin, h thng cha x l c cc u vo khng r rng, ch a p dng c cho cc lnh vc ton khc do kho d liu cha .
50
51
Ting Anh [8] Brad Leupen, R.Allen Wyke, Sultan Rehman, XML Programming. [9] OReilly, Jesse Liberty, Programming C#, - Windows Forms Programming with C#, Erik Brown, Manning. [10] The eXperTs Voice in .NET, Beginning XML with C# 2008, From Novice to Professional, Bipin Joshi Master the .NET Frameworks XML features to build powerful, data-driven applications. [11] http://msdn.microsoft.com
52