You are on page 1of 12

‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﻫﻮش ﻣﺼﻨﻮﻋﯽ‬
‫‪Artificial Intelligence‬‬
‫ﻧﺎم ﮐﺘﺎب ‪ :‬ﻫﻮش ﻣﺼﻨﻮﻋﯽ رﻫﯿﺎﺗﯽ ﻧﻮﯾﻦ‬
‫ﻫﻮش ﻣﺼﻨﻮﻋﯽ‬
‫ﻣﻮﻟﻒ ‪ :‬راﺳﻞ و ﻧﻮروﯾﮓ‬
‫ﻓﺼﻞ دوم‪-‬ﻋﺎﻣﻠﻬﺎي ﻫﻮﺷﻤﻨﺪ‬

‫ﻣﻬﺪي ﺑﺎزرﮔﺎﻧﯽ‬
‫داﻧﺸﮕﺎه آزاد اﺳﻼﻣﯽ زﻧﺠﺎن‬

‫‪http://mbzir.com‬‬ ‫‪, http://csiz.ir‬‬


‫‪.‬‬

‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻋﺎﻣﻞ ﻫﺎ‬


‫‪3‬‬ ‫‪4‬‬

‫ﻋﺎﻣﻞ ﻫﺎ و ﻣﺤﯿﻂ ﻫﺎ‬ ‫‪‬‬ ‫ﻋﺎﻣﻞ‪ :‬ﻫﺮ ﭼﯿﺰي ﮐﻪ ﺑﺘﻮاﻧﺪ ﻣﺤﯿﻂ ﭘﯿﺮاﻣﻮﻧﺶ را از ﻃﺮﯾﻖ ﺣﺴﮕﺮﻫﺎ درك‬ ‫‪‬‬

‫ﻋﻘﻼﻧﯽ ﺑﻮدن‬ ‫‪‬‬ ‫ﮐﻨﺪ و در آن ﻣﺤﯿﻂ از ﻃﺮﯾﻖ اﺛﺮﮐﻨﻨﺪه ﻫﺎ ﻋﻤﻞ ﮐﻨﺪ‪.‬‬


‫‪)PEAS‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ ،‬ﻣﺤﯿﻂ‪ ،‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ ،‬ﺣﺴﮕﺮﻫﺎ(‬ ‫‪‬‬ ‫ﻋﺎﻣﻞ اﻧﺴﺎﻧﯽ‪:‬‬ ‫‪‬‬

‫اﻧﻮاع ﻣﺤﯿﻂ ﻫﺎ‬ ‫‪‬‬


‫‪ ‬ﭼﺸﻢ ﻫﺎ و ﮔﻮش ﻫﺎ و ﺳﺎﯾﺮ اﻧﺪام ﻫﺎي ﺣﺴﯽ ﺑﻪ ﻋﻨﻮان ﺣﺴﮕﺮﻫﺎ‬
‫‪ ‬دﺳﺖ ﻫﺎ‪ ،‬ﭘﺎﻫﺎ‪ ،‬دﻫﺎن و ﺳﺎﯾﺮ اﻋﻀﺎي ﺑﺪن ﺑﻪ ﻋﻨﻮان اﺛﺮ ﮐﻨﻨﺪه ﻫﺎ‬
‫اﻧﻮاع ﻋﺎﻣﻞ ﻫﺎ‬ ‫‪‬‬
‫ﻋﺎﻣﻞ روﺑﺎت‪:‬‬ ‫‪‬‬

‫‪ ‬دورﺑﯿﻦ ﻫﺎ و ﻓﺎﺻﻠﻪ ﯾﺎب ﻣﺎدون ﻗﺮﻣﺰ ﺑﻪ ﻋﻨﻮان ﺣﺴﮕﺮﻫﺎ‬


‫‪ ‬اﻧﻮاع ﻣﻮﺗﻮرﻫﺎ ﺑﻪ ﻋﻨﻮان اﺛﺮ ﮐﻨﻨﺪه ﻫﺎ‬

‫‪١‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﻋﺎﻣﻞ ﻫﺎ و ﻣﺤﯿﻂ ﻫﺎ‬ ‫دﻧﯿﺎي ﺟﺎرو ﺑﺮﻗﯽ‬


‫‪5‬‬ ‫‪6‬‬

‫ﺗﺎﺑﻊ ﻋﺎﻣﻞ ﺗﺎرﯾﺨﭽﻪ ادراﮐﯽ را ﺑﻪ اﻋﻤﺎل ﻧﮕﺎﺷﺖ ﻣﯽ ﮐﻨﺪ‪:‬‬ ‫‪‬‬

‫]‪[f: P*  A‬‬
‫ادراك ﻫﺎ‪ :‬ﻣﮑﺎن ﻫﺎ و ﻣﺤﺘﻮﯾﺎت آﻧﻬﺎ‪ ،‬ﻣﺎﻧﻨﺪ ]‪[A, Dirty‬‬ ‫‪‬‬
‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﺑﺮاي اﯾﺠﺎد ‪ f‬ﺑﺮ روي ﻣﻌﻤﺎري ﻓﯿﺰﯾﮑﯽ اﺟﺮا ﻣﯽ ﺷﻮد‪.‬‬ ‫‪‬‬

‫ﻋﺎﻣﻞ = ﻣﻌﻤﺎري ‪ +‬ﺑﺮﻧﺎﻣﻪ‬ ‫‪‬‬


‫اﻋﻤﺎل‪ :‬ﺣﺮﮐﺖ ﺑﻪ ﭼﭗ و راﺳﺖ‪ ،‬ﻣﮑﺶ و ‪NoOp‬‬ ‫‪‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ اﯾﺪه آل‬


‫‪7‬‬ ‫‪8‬‬

‫ﯾﮏ ﻋﺎﻣﻞ ﺑﺎﯾﺪ ﺑﺮ اﺳﺎس آﻧﭽﻪ ﮐﻪ ﻣﯽ ﺗﻮاﻧﺪ درك ﮐﻨﺪ و اﻋﻤﺎﻟﯽ ﮐﻪ ﻣﯽ ﺗﻮاﻧﺪ‬ ‫‪‬‬
‫اﻧﺠﺎم دﻫﺪ‪» ،‬ﮐﺎر درﺳﺖ را اﻧﺠﺎم دﻫﺪ«‪ .‬ﻋﻤﻞ درﺳﺖ آن اﺳﺖ ﮐﻪ ﺑﺎﻋﺚ ﺷﻮد‬ ‫ﻋﺎﻣﻞ ﻋﻘﻼﻧﯽ اﯾﺪه آل‪ :‬ﺑﺮاي ﻫﺮ دﻧﺒﺎﻟﻪ ادراﮐﯽ ﻣﻤﮑﻦ‪ ،‬ﯾﮏ ﻋﺎﻣﻞ ﻋﻘﻼﻧﯽ‬ ‫‪‬‬
‫ﻋﺎﻣﻞ ﺑﯿﺸﺘﺮﯾﻦ ﻣﻮﻓﻘﯿﺖ را ﺑﺪﺳﺖ آورد‪.‬‬ ‫ﺑﺎﯾﺪ ﺑﺮ اﺳﺎس ﺷﻮاﻫﺪ درﯾﺎﻓﺘﯽ از دﻧﺒﺎﻟﻪ ادراﮐﯽ و داﻧﺶ دروﻧﯽ‪ ،‬ﻋﻤﻠﯽ‬
‫ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬ﯾﮏ ﻣﻌﯿﺎر ﻫﺪف ﺑﺮاي ﺳﻨﺠﺶ ﻣﯿﺰان ﻣﻮﻓﻘﯿﺖ رﻓﺘﺎر ﯾﮏ ﻋﺎﻣﻞ‬ ‫‪‬‬ ‫را اﻧﺘﺨﺎب ﮐﻨﺪ ﮐﻪ اﻧﺘﻈﺎر ﻣﯽ رود ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ اش را ﺑﻪ ﺣﺪاﮐﺜﺮ‬
‫ﻣﺜﺎل‪ :‬ﻣﻌﯿﺎر ﻣﻮﻓﻘﯿﺖ ﻋﺎﻣﻞ دﻧﯿﺎي ﺟﺎرو ﺑﺮﻗﯽ‪:‬‬ ‫‪‬‬ ‫ﺑﺮﺳﺎﻧﺪ‪.‬‬
‫‪ ‬ﻣﻘﺪار ﮔﺮد و ﺧﺎك ﺗﻤﯿﺰ ﺷﺪه‬
‫‪ ‬ﻣﯿﺰان زﻣﺎن ﻣﺼﺮف ﺷﺪه‬
‫‪ ‬ﻣﻘﺪار ﺑﺮق ﻣﺼﺮف ﺷﺪه‬
‫‪ ‬ﻣﯿﺰان ﺳﺮ و ﺻﺪاي ﺗﻮﻟﯿﺪ ﺷﺪه و ‪...‬‬

‫‪٢‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ‬ ‫‪PEAS‬‬


‫‪9‬‬ ‫‪10‬‬

‫‪PEAS: Performance measure, Environment, Actuators, Sensors‬‬ ‫‪‬‬


‫ﻋﻘﻼﻧﯽ ﺑﻮدن ﺑﺎ داﻧﺶ ﮐﻞ ﺑﻮدن ) داﻧﺴﺘﻦ ﻫﻤﻪ ﭼﯿﺰ ﺗﻮﺳﻂ داﻧﺶ‬ ‫‪‬‬ ‫در ﻃﺮاﺣﯽ ﯾﮏ ﻋﺎﻣﻞ اﺑﺘﺪا ﺑﺎﯾﺪ ﻣﻮارد ﺑﺎﻻ ﺗﻌﯿﯿﻦ ﮔﺮدﻧﺪ‪.‬‬ ‫‪‬‬
‫ﻧﺎﻣﺤﺪود( ﺗﻔﺎوت دارد‪.‬‬
‫ﻣﺜﺎل‪ :‬ﻃﺮاﺣﯽ ﯾﮏ راﻧﻨﺪه ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬
‫ﻋﺎﻣﻞ ﻣﯽ ﺗﻮاﻧﺪ اﻋﻤﺎﻟﯽ را اﻧﺠﺎم دﻫﺪ ﮐﻪ از ﻃﺮﯾﻖ ﺗﻐﯿﯿﺮ در ادراك ﻫﺎي‬ ‫‪‬‬
‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬اﻣﻨﯿﺖ‪ ،‬ﺳﺮﻋﺖ‪ ،‬راﺣﺘﯽ‪ ،‬ﺳﻮد و ‪...‬‬
‫آﺗﯽ اﻃﻼﻋﺎت ﻣﻔﯿﺪ ﺑﺪﺳﺖ آورد )ﺟﻤﻊ آوري داﻧﺶ‪ ،‬اﮐﺘﺸﺎف(‬
‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﺧﯿﺎﺑﺎن ﻫﺎ‪ ،‬اﻓﺮاد ﭘﯿﺎده‪ ،‬ﻣﺸﺘﺮي ﻫﺎ و ‪...‬‬
‫ﯾﮏ ﻋﺎﻣﻞ ﺧﻮدﻣﺨﺘﺎر اﺳﺖ اﮔﺮ رﻓﺘﺎرش ﺑﺮ اﺳﺎس ﺗﺠﺮﺑﻪ اش ﺗﻌﯿﯿﻦ‬ ‫‪‬‬
‫‪ ‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ :‬ﻓﺮﻣﺎن‪ ،‬ﺷﺘﺎب دﻫﻨﺪه‪ ،‬ﺗﺮﻣﺰﻫﺎ‪ ،‬ﺑﻮق‪ ،‬ﭼﺮاغ ﻫﺎ و ‪...‬‬
‫ﺷﻮد ) ﺑﻪ ﻫﻤﺮاه ﻗﺎﺑﻠﯿﺖ ﯾﺎدﮔﯿﺮي و ﺗﻄﺒﯿﻖ ﭘﺬﯾﺮي(‬ ‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬دورﺑﯿﻦ ﻫﺎ‪ ،‬ﺣﺴﮕﺮﻫﺎي ﺻﻮﺗﯽ )‪ ،(Sonar‬ﺳﺮﻋﺖ ﺳﻨﺞ‪،GPS ،‬‬
‫ﮐﯿﻠﻮﻣﺘﺮ ﺷﻤﺎر‪ ،‬ﺣﺴﮕﺮﻫﺎي ﻣﻮﺗﻮر‪ ،‬ﺻﻔﺤﻪ ﮐﻠﯿﺪ‪ ،‬ﻣﯿﮑﺮوﻓﻮن و ‪...‬‬

‫‪PEAS‬‬ ‫‪PEAS‬‬
‫‪11‬‬ ‫‪12‬‬

‫ﻋﺎﻣﻞ‪ :‬ﺳﯿﺴﺘﻢ ﺗﺸﺨﯿﺺ ﭘﺰﺷﮑﯽ‬ ‫‪‬‬ ‫ﻋﺎﻣﻞ‪ :‬روﺑﺎت ﺟﺎﺑﻪ ﺟﺎ ﮐﻨﻨﺪه اﺷﯿﺎء‬ ‫‪‬‬

‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬ﺳﻼﻣﺘﯽ ﺑﯿﻤﺎر‪ ،‬ﺑﻪ ﺣﺪاﻗﻞ رﺳﺎﻧﺪن ﻫﺰﯾﻨﻪ و ‪...‬‬ ‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬درﺻﺪ ﻗﻄﻌﺎﺗﯽ ﮐﻪ در ﺻﻨﺪوق درﺳﺖ ﻗﺮار ﻣﯽ ﮔﯿﺮﻧﺪ‬
‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﺑﯿﻤﺎر‪ ،‬ﺑﯿﻤﺎرﺳﺘﺎن‪ ،‬ﮐﺎرﻣﻨﺪان و ‪...‬‬ ‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﻧﻮار ﻧﻘﺎﻟﻪ و اﺷﯿﺎء روي آن‪ ،‬ﺻﻨﺪوق ﻫﺎ‬
‫‪ ‬اﺛﺮ ﮐﻨﻨﺪه ﻫﺎ‪ :‬ﺻﻔﺤﻪ ﻧﻤﺎﯾﺶ )ﭘﺮﺳﺶ ﻫﺎ‪ ،‬آزﻣﺎﯾﺶ ﻫﺎ‪ ،‬ﺗﺸﺨﯿﺺ ﻫﺎ‪ ،‬ﻣﺪاوا(‬ ‫‪ ‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ :‬ﺑﺎزوﻫﺎ و دﺳﺖ‬
‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬ﺻﻔﺤﻪ ﮐﻠﯿﺪ ) درﯾﺎﻓﺖ ﻋﻼﯾﻢ‪ ،‬ﯾﺎﻓﺘﻪ ﻫﺎ و ﭘﺎﺳﺦ ﻫﺎي ﺑﯿﻤﺎر(‬ ‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬دورﺑﯿﻦ‪ ،‬ﺣﺴﮕﺮ زاوﯾﻪ ﻣﻔﺎﺻﻞ‬

‫‪٣‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫‪PEAS‬‬ ‫ﻣﺤﯿﻂ‬
‫‪13‬‬ ‫‪14‬‬

‫ﻫﺮ ﻣﺤﯿﻂ داراي ﻣﺠﻤﻮﻋﻪ اي از ﺣﺎﻟﺖ ﻫﺎ ﻣﯽ ﺑﺎﺷﺪ‪:‬‬ ‫‪‬‬

‫آﻣﻮزش دﻫﻨﺪه زﺑﺎن ﺑﻪ ﺻﻮرت ﻣﺤﺎوره اي‬ ‫‪‬‬ ‫‪ ‬ﻣﺤﯿﻂ در ﻫﺮ ﻟﺤﻈﻪ ﻓﻘﻂ در ﯾﮑﯽ از اﯾﻦ ﺣﺎﻟﺖ ﻫﺎ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬
‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬ﺑﻪ ﺣﺪاﮐﺜﺮ رﺳﺎﻧﺪن ﻧﻤﺮه داﻧﺶ آﻣﻮز در اﻣﺘﺤﺎن‬
‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﻣﺠﻤﻮﻋﻪ داﻧﺶ آﻣﻮزان‬ ‫ﻣﺜﺎل‪ :‬دﻧﯿﺎي ﻣﮑﺶ‬ ‫‪‬‬

‫‪ ‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ :‬ﺻﻔﺤﻪ ﻧﻤﺎﯾﺶ )ﺗﻤﺮﯾﻦ ﻫﺎ‪ ،‬ﭘﯿﺸﻨﻬﺎدات و اﺻﻼﺣﺎت(‬


‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬ﺻﻔﺤﻪ ﮐﻠﯿﺪ‬
‫}‪S = {1, 2, 3, 4, 5, 6, 7, 8‬‬

‫ﻋﺎﻣﻞ و ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬


‫‪15‬‬ ‫‪16‬‬

‫در ﻟﺤﻈﻪ ﺷﺮوع‪ ،‬ﻣﺤﯿﻂ در ﯾﮑﯽ از ﺣﺎﻟﺖ ﻫﺎي ﻣﻤﮑﻦ ﻣﯽ ﺑﺎﺷﺪ‬ ‫‪‬‬ ‫ﮐﺎﻣﻼ ﻗﺎﺑﻞ ﻣﺸﺎﻫﺪه )در ﻣﻘﺎﺑﻞ ﻣﺸﺎﻫﺪه ﭘﺬﯾﺮ ﺟﺰﺋﯽ(‪ :‬ﻣﺤﯿﻄﯽ ﮐﻪ در آن‬ ‫‪‬‬

‫‪ ‬ﻋﻤﻞ ﻋﺎﻣﻞ در ﻣﺤﯿﻂ‪ ،‬ﺑﺎﻋﺚ ﺗﻐﯿﯿﺮ ﺣﺎﻟﺖ ﻣﺤﯿﻂ ﻣﯽ ﺷﻮد‬ ‫در ﻫﺮ ﻟﺤﻈﻪ از زﻣﺎن ﺣﺴﮕﺮﻫﺎي ﻋﺎﻣﻞ ﺑﻪ آن اﻣﮑﺎن دﺳﺘﯿﺎﺑﯽ ﺑﻪ ﺣﺎﻟﺖ‬
‫‪ ‬ﺣﺎﻟﺖ ﻓﻌﻠﯽ‪Si :‬‬ ‫ﮐﺎﻣﻞ ﻣﺤﯿﻂ را ﻣﯽ دﻫﻨﺪ‪.‬‬
‫‪Action‬‬ ‫‪ ‬ﻋﻤﻞ ﻋﺎﻣﻞ‪Action :‬‬
‫‪Si‬‬ ‫‪Sj‬‬ ‫‪ ‬ﺣﺎﻟﺖ ﺑﻌﺪي‪Sj :‬‬ ‫]‪[location, status‬‬ ‫ﻣﺜﺎل‪ :‬دﻧﯿﺎي ﻣﮑﺶ – ﺣﺴﮕﺮﻫﺎ‪:‬‬ ‫‪‬‬

‫‪ ‬ﺗﺸﺨﯿﺺ ﻣﮑﺎن ‪ :‬ﭼﭗ ﯾﺎ راﺳﺖ‬


‫ﻣﺜﺎل‪ :‬دﻧﯿﺎي ﻣﮑﺶ‬ ‫‪‬‬
‫‪ ‬ﺗﺸﺨﯿﺺ وﺿﻌﯿﺖ‪ :‬ﺗﻤﯿﺰ ﯾﺎ ﮐﺜﯿﻒ‬

‫‪SUCK‬‬ ‫] ]‪[ LEFT, [CLEAN, DIRTY‬‬

‫‪۴‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫اﻧﻮاع ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬


‫‪17‬‬ ‫‪18‬‬

‫ﻗﻄﻌﯽ‪) :‬در ﻣﻘﺎﺑﻞ اﺗﻔﺎﻗﯽ(‪ :‬ﺣﺎﻟﺖ ﺑﻌﺪي ﻣﺤﯿﻂ ﮐﺎﻣﻼ ﺑﻮﺳﯿﻠﻪ ﺣﺎﻟﺖ ﻓﻌﻠﯽ و‬ ‫‪‬‬ ‫اﭘﯿﺰودﯾﮏ )در ﻣﻘﺎﺑﻞ ﺗﺮﺗﯿﺒﯽ(‪ :‬ﺗﺠﺮﺑﻪ ﻋﺎﻣﻞ ﺑﻪ »دوره ﻫﺎي« ﻏﯿﺮﻗﺎﺑﻞ‬ ‫‪‬‬
‫ﻋﻤﻞ اﻧﺠﺎم ﺷﺪه ﺗﻮﺳﻂ ﻋﺎﻣﻞ ﻗﺎﺑﻞ ﺗﻌﯿﯿﻦ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬ ‫ﺗﺠﺰﯾﻪ ﺗﻘﺴﯿﻢ ﻣﯽ ﺷﻮد )ﻫﺮ دوره ﺷﺎﻣﻞ ادراك ﻋﺎﻣﻞ و ﺳﭙﺲ اﻧﺠﺎم ﯾﮏ‬
‫‪ ‬اﮔﺮ ﻣﺤﯿﻂ ﺑﻪ ﺟﺰ در ﻣﻮرد ﻋﻤﻞ ﻋﺎﻣﻞ ﻫﺎي دﯾﮕﺮ ﻗﻄﻌﯽ ﺑﺎﺷﺪ‪ ،‬آﻧﮕﺎه ﻣﺤﯿﻂ‬ ‫ﻋﻤﻞ ﻣﯽ ﺑﺎﺷﺪ( و اﻧﺘﺨﺎب ﻋﻤﻞ در ﻫﺮ دوره ﺗﻨﻬﺎ ﺑﻪ ﺧﻮد ﻫﻤﺎن دوره‬
‫اﺳﺘﺮاﺗﮋﯾﮏ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬ ‫ﺑﺴﺘﮕﯽ دارد‪.‬‬
‫‪SUCK‬‬

‫ﻣﺜﺎل‪ :‬روﺑﺎت ﮐﻨﺘﺮل ﮐﻨﻨﺪه ﮐﯿﻔﯿﺖ‬ ‫‪‬‬


‫‪Episode 1‬‬ ‫‪Episode 2‬‬ ‫‪Episode 3‬‬
‫اﺗﻔﺎﻗﯽ‬ ‫ﻗﻄﻌﯽ‬
‫‪SUCK‬‬

‫‪SUCK‬‬
‫‪3‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪2‬‬ ‫‪5‬‬ ‫‪4‬‬ ‫‪3‬‬

‫‪Accept‬‬ ‫‪Reject‬‬ ‫‪Accept‬‬

‫اﻧﻮاع ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬


‫‪19‬‬ ‫‪20‬‬

‫اﯾﺴﺘﺎ )در ﻣﻘﺎﺑﻞ ﭘﻮﯾﺎ(‪ :‬ﻣﺤﯿﻂ در ﺣﯿﻦ ﺳﻨﺠﺶ ﻋﺎﻣﻞ )ﺑﺮاي اﻧﺘﺨﺎب ﻋﻤﻞ(‬ ‫‪‬‬ ‫ﮔﺴﺴﺘﻪ )در ﻣﻘﺎﺑﻞ ﭘﯿﻮﺳﺘﻪ(‪ :‬ﻣﺤﯿﻄﯽ ﮐﻪ در آن ﺗﻌﺪاد ﻣﺤﺪود و ﻣﺘﻤﺎﯾﺰي از‬ ‫‪‬‬

‫ﺗﻐﯿﯿﺮ ﻧﻤﯽ ﮐﻨﺪ‪ .‬اﮔﺮ ﺧﻮد ﻣﺤﯿﻂ ﺑﺎ ﮔﺬﺷﺖ زﻣﺎن ﺗﻐﯿﯿﺮ ﻧﮑﻨﺪ وﻟﯽ ﻣﻌﯿﺎر‬ ‫درك ﻫﺎ و ﻋﻤﻞ ﻫﺎي ﮐﺎﻣﻼ واﺿﺢ ﺗﻌﺮﯾﻒ ﺷﺪه ﺑﺎﺷﺪ‪.‬‬
‫ﮐﺎرآﯾﯽ ﻋﺎﻣﻞ ﺗﻐﯿﯿﺮ ﮐﻨﺪ‪ ،‬آﻧﮕﺎه ﻣﺤﯿﻂ ﻧﯿﻤﻪ ﭘﻮﯾﺎ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬
‫در ﻣﺤﯿﻂ ﮔﺴﺴﺘﻪ‪ ،‬ﻣﺠﻤﻮﻋﻪ ﺣﺎﻻت ﻣﺤﯿﻂ ﯾﮏ ﻣﺠﻤﻮﻋﻪ ﮔﺴﺴﺘﻪ ﻣﯽ ﺑﺎﺷﺪ و‬ ‫‪‬‬
‫ﺣﺎﻻت ﺑﺴﺎدﮔﯽ ﻗﺎﺑﻞ ﺗﻤﺎﯾﺰ ﻣﯽ ﺑﺎﺷﻨﺪ‪.‬‬
‫ﺳﻨﺠﺶ ﻣﺤﯿﻂ‬ ‫‪ ‬ﻣﺜﺎل‪ :‬ﻣﺤﯿﻂ دﻧﯿﺎي ﻣﮑﺶ‬
‫‪t‬‬ ‫’‪t‬‬ ‫‪State = {1, 2, …, 8} ‬‬
‫‪S‬‬ ‫‪S‬‬ ‫اﯾﺴﺘﺎ‬ ‫‪Action = {Left, Right, Suck, NoOp} ‬‬
‫‪Percept = {[Left, Clean], [Left, Dirty], [Right, Clean], …} ‬‬
‫‪S‬‬ ‫’‪S‬‬ ‫ﭘﻮﯾﺎ‬

‫‪۵‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫اﻧﻮاع ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬


‫‪21‬‬ ‫‪22‬‬

‫ﺗﮏ ﻋﺎﻣﻠﯽ )در ﺑﺮاﺑﺮ ﭼﻨﺪ ﻋﺎﻣﻠﯽ(‪ :‬ﯾﮏ ﻋﺎﻣﻞ ﺧﻮدش ﺑﻪ ﺗﻨﻬﺎﯾﯽ در ﻣﺤﯿﻂ‬ ‫‪‬‬ ‫راﻧﻨﺪﮔﯽ ﺗﺎﮐﺴﯽ‬ ‫ﺷﻄﺮﻧﺞ ﺑﺪون‬
‫ﺳﺎﻋﺖ‬
‫ﺷﻄﺮﻧﺞ ﺑﺎ ﺳﺎﻋﺖ‬

‫ﻋﻤﻞ ﻣﯽ ﮐﻨﺪ‪.‬‬ ‫ﺧﯿﺮ‬ ‫ﺑﻠﻪ‬ ‫ﺑﻠﻪ‬ ‫ﮐﺎﻣﻼ ﻗﺎﺑﻞ ﻣﺸﺎﻫﺪه‬


‫‪ ‬ﻣﺜﺎل‪ :‬ﻣﺤﯿﻂ ﻋﺎﻣﻞ ﺣﻞ ﮐﻨﻨﺪه ﺟﺪول ﮐﻠﻤﺎت ﻣﺘﻘﺎﻃﻊ و دﻧﯿﺎي ﻣﮑﺶ‬ ‫ﺧﯿﺮ‬ ‫اﺳﺘﺮاﺗﮋﯾﮏ‬ ‫اﺳﺘﺮاﺗﮋﯾﮏ‬ ‫ﻗﻄﻌﯽ‬

‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫دوره اي‬


‫ﭼﻨﺪ ﻋﺎﻣﻠﯽ‪ :‬ﺗﻌﺪادي ﻋﺎﻣﻞ ﮐﻪ ﺑﺎ ﯾﮑﺪﯾﮕﺮ در ﺗﻌﺎﻣﻞ ﻣﯽ ﺑﺎﺷﻨﺪ‪.‬‬ ‫‪‬‬ ‫ﺧﯿﺮ‬ ‫ﺑﻠﻪ‬ ‫ﻧﯿﻤﻪ ﭘﻮﯾﺎ‬ ‫اﯾﺴﺘﺎ‬
‫‪ ‬ﻣﺜﺎل‪ :‬ﺷﻄﺮﻧﺞ )رﻗﺎﺑﺘﯽ(‪ ،‬روﺑﻮﮐﺎپ )ﺑﯿﻦ اﻋﻀﺎي ﯾﮏ ﺗﯿﻢ ﻫﻤﯿﺎري و ﺑﯿﻦ اﻋﻀﺎي‬ ‫ﺧﯿﺮ‬ ‫ﺑﻠﻪ‬ ‫ﺑﻠﻪ‬ ‫ﮔﺴﺴﺘﻪ‬
‫دو ﺗﯿﻢ رﻗﺎﺑﺘﯽ(‪ ،‬ﻣﺤﯿﻂ ﺗﺎﮐﺴﯽ ﺧﻮدﮐﺎر )ﻫﻤﯿﯿﺎري ﺟﺰﯾﯽ(‬
‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫ﺗﮏ ﻋﺎﻣﻠﯽ‬

‫• ﻧﻮع ﻣﺤﯿﻂ ﺑﻪ ﻣﯿﺰان زﯾﺎدي ﺗﻌﯿﯿﻦ ﮐﻨﻨﺪه ﻃﺮاﺣﯽ ﻋﺎﻣﻞ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬


‫• دﻧﯿﺎي واﻗﻌﯽ‪ :‬ﻣﺸﺎﻫﺪه ﭘﺬﯾﺮ ﺟﺰﺋﯽ‪ ،‬اﺗﻔﺎﻗﯽ‪ ،‬ﺗﺮﺗﯿﺒﯽ‪ ،‬ﭘﻮﯾﺎ‪ ،‬ﭘﯿﻮﺳﺘﻪ و ﭼﻨﺪﻋﺎﻣﻠﯽ‬

‫ﺗﻮاﺑﻊ و ﺑﺮﻧﺎﻣﻪ ﻫﺎي ﻋﺎﻣﻞ‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬


‫‪23‬‬ ‫‪24‬‬

‫ﯾﮏ ﻋﺎﻣﻞ ﮐﺎﻣﻼ ﺑﻮﺳﯿﻠﻪ ﺗﺎﺑﻊ ﻋﺎﻣﻞ ﻣﺸﺨﺺ ﻣﯽ ﺷﻮد‪.‬‬ ‫‪‬‬ ‫ﯾﮏ روش ﺑﻪ ﻣﻨﻈﻮر ﺗﻮﺻﯿﻒ ﺗﺎﺑﻊ ﻋﺎﻣﻞ‬ ‫‪‬‬

‫‪ ‬ﯾﺎدآوري‪ :‬ﺗﺎﺑﻊ ﻋﺎﻣﻞ دﻧﺒﺎﻟﻪ ادراﮐﯽ را ﺑﻪ ﻋﻤﻞ ﻧﮕﺎﺷﺖ ﻣﯽ ﮐﻨﺪ‪.‬‬ ‫ﻧﺸﺎن دﻫﻨﺪه ﻓﻌﺎﻟﯿﺖ ﻣﻨﺎﺳﺐ ﺑﺮاي ﻫﺮ دﻧﺒﺎﻟﻪ ادراﮐﯽ ﻣﻤﮑﻦ‬ ‫‪‬‬

‫‪Percept Sequence‬‬ ‫‪Action‬‬ ‫ﻣﺜﺎل‪ :‬ﺟﺪول دﻧﯿﺎي ﺟﺎروﺑﺮﻗﯽ‬ ‫‪‬‬

‫ﯾﮏ ﺗﺎﺑﻊ ﻋﺎﻣﻞ )ﯾﺎ ﯾﮏ ﮐﻼس ﻫﻢ ارزي ﮐﻮﭼﮏ( ﻋﻘﻼﻧﯽ )‪(rational‬ﻣﯽ‬ ‫‪‬‬ ‫]‪[A, Clean‬‬ ‫‪Right‬‬
‫ﺑﺎﺷﺪ‪.‬‬ ‫]‪[A, Dirty‬‬ ‫‪Suck‬‬
‫]‪[B, Clean‬‬ ‫‪Left‬‬
‫]‪[B, Dirty‬‬ ‫‪Suck‬‬
‫ﻫﺪف‪ :‬ﯾﺎﻓﺘﻦ روﺷﯽ ﺑﻪ ﻣﻨﻈﻮر ﭘﯿﺎده ﺳﺎزي ﺗﺎﺑﻊ ﻋﺎﻣﻞ ﻋﻘﻼﻧﯽ ﺑﻪ ﻃﻮر‬ ‫‪‬‬
‫]‪[A, Clean], [A, Clean‬‬ ‫‪Right‬‬
‫ﻣﺨﺘﺼﺮ و ﻣﻔﯿﺪ‬ ‫]‪[A, Clean], [A, Dirty‬‬ ‫‪Suck‬‬
‫…‬

‫‪۶‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬


‫‪25‬‬ ‫‪26‬‬

‫‪function TABLE-DRIVEN-AGENT( percept) returns an action‬‬


‫‪static: percepts, a sequence, initially empty‬‬ ‫ﻣﻌﺎﯾﺐ‪:‬‬ ‫‪‬‬

‫‪table, a table of actions, indexed by percept sequence,‬‬ ‫ﺳﻄﺮ(‬ ‫‪10150‬‬


‫‪ ‬ﺟﺪول ﺑﺴﯿﺎر ﻋﻈﯿﻢ )ﻣﺜﻼ در ﺷﻄﺮﻧﺞ‬
‫‪initially fully specified‬‬ ‫‪ ‬زﻣﺎن ﺑﺴﯿﺎر زﯾﺎد ﺑﺮاي اﯾﺠﺎد ﺟﺪول و اﺣﺘﻤﺎل ﺑﺎﻻي ﺧﻄﺎ‬
‫‪ ‬ﻋﺪم ﺧﻮد ﻣﺨﺘﺎري‬
‫‪append percept to the end of percepts‬‬ ‫‪ ‬ﺣﺘﯽ ﺑﺎ ﻗﺎﺑﻠﯿﺖ ﯾﺎدﮔﯿﺮي‪ ،‬ﻧﯿﺎز ﺑﻪ زﻣﺎن ﺑﺴﯿﺎر زﯾﺎدي ﺑﺮاي ﯾﺎدﮔﯿﺮي ﻣﺪاﺧﻞ‬
‫)‪action  LOOKUP( percepts, table‬‬ ‫ﺟﺪول دارد‪.‬‬
‫‪return action‬‬

‫اﻧﻮاع ﻋﺎﻣﻞ ﻫﺎ‬ ‫ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده‬


‫‪27‬‬ ‫‪28‬‬ ‫ﺳﺎده ﺗﺮﯾﻦ ﻧﻮع ﻋﺎﻣﻞ‬ ‫‪‬‬
‫در ﻫﺮ ﻟﺤﻈﻪ‪ ،‬ﻋﻤﻞ ﺗﻨﻬﺎ ﺑﺮ اﺳﺎس درك ﻓﻌﻠﯽ اﻧﺘﺨﺎب ﻣﯽ ﺷﻮد‬ ‫‪‬‬

‫ﭼﻬﺎر ﻧﻮع اﺻﻠﯽ ﺑﻪ ﺗﺮﺗﯿﺐ اﻓﺰاﯾﺶ ﻋﻤﻮﻣﯿﺖ )‪:(Generality‬‬ ‫‪‬‬ ‫ﻣﺜﺎل‪:‬‬ ‫‪‬‬

‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده )‪(Simple reflex‬‬


‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل )‪(Model-based reflex‬‬ ‫‪function REFLEX-VACCUM-AGENT( [location, status]) returns an action‬‬

‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف )‪(Goal-based‬‬ ‫‪if status = Dirty then return Suck‬‬
‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي )‪(Utility-based‬‬ ‫‪else if location = A then return Right‬‬
‫‪else if location = B then return Left‬‬

‫ﺷﺎﻣﻞ ﻗﻮاﻧﯿﻦ ﺷﺮط‪-‬ﻋﻤﻞ ﻣﺎﻧﻨﺪ‪:‬‬ ‫‪‬‬


‫‪” ‬اﮔﺮ ﭼﺮاغ ﺗﺮﻣﺰ اﺗﻮﻣﻮﺑﯿﻞ ﺟﻠﻮﯾﯽ روﺷﻦ ﺷﺪ‪ ،‬آﻧﮕﺎه ﺗﺮﻣﺰ ﮐﻦ“‬

‫‪٧‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﺳﺎﺧﺘﺎر ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده‬ ‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﺳﺎده‬


‫‪29‬‬ ‫‪30‬‬

‫‪Agent‬‬ ‫‪Sensors‬‬ ‫‪function SIMPLE-REFLEX-AGENT( percept) returns an action‬‬


‫‪static: rules, a set of condition-action rules‬‬
‫‪What the world‬‬
‫‪is like now‬‬

‫‪Environment‬‬
‫)‪state  INTERPRET-INPUT( percept‬‬
‫)‪rule  RULE-MATCH( state, rules‬‬
‫]‪action  RULE-ACTION[ rule‬‬
‫‪What action I‬‬
‫‪Condition-action rules‬‬ ‫‪return action‬‬
‫‪should do now‬‬

‫‪Actuators‬‬

‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬ ‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل)اداﻣﻪ‪(...‬‬


‫‪31‬‬ ‫‪32‬‬

‫ﻋﺎﻣﻞﻫﺎﯾﯽ ﮐﻪ اﺛﺮات دﻧﯿﺎ را ﺣﻔﻆ ﻣﯽﮐﻨﻨﺪ‬


‫ﺑﻬﻨﮕﺎمﺳﺎزي اﻃﻼﻋﺎت وﺿﻌﯿﺖ داﺧﻠﯽ ﻫﻤﺰﻣﺎن ﺑﺎ ﮔﺬر زﻣﺎن ﻧﯿﺎزﻣﻨﺪ دو ﻧﻮع داﻧﺶ ﮐﺪ‬
‫ﺷﺪه در ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ اﺳﺖ‪.‬‬
‫از آﻧﺠﺎﯾﯽ ﻧﺎﺷﯽ ﻣﯽﺷﻮد ﮐﻪ ﺣﺴﮕﺮﻫﺎ ﻧﻤﯽﺗﻮاﻧﻨﺪ دﺳﺘﺮﺳﯽ ﮐﺎﻣﻞ ﺑﻪ وﺿﻌﯿﺖ دﻧﯿﺎ را ﺑﻪ‬
‫وﺟﻮد آورﻧﺪ‪.‬‬
‫اول‪ :‬ﻧﯿﺎزﻣﻨﺪ آﻧﯿﻢ ﮐﻪ ﺑﺮﺧﯽ اﻃﻼﻋﺎت درﺑﺎره ﭼﮕﻮﻧﮕﯽ ﺗﻐﯿﯿﺮ ﺟﻬﺎن ﻣﺴﺘﻘﻞ از ﻋﺎﻣﻞ را‬
‫در ﭼﻨﯿﻦ ﺷﺮاﯾﻄﯽ‪ ،‬ﻋﺎﻣﻞ ﻣﻤﮑﻦ اﺳﺖ ﻧﯿﺎزﻣﻨﺪ دﺳﺘﮑﺎري ﺑﺮﺧﯽ اﻃﻼﻋﺎت وﺿﻌﯿﺖ داﺧﻠﯽ‬
‫داﺷﺘﻪ ﺑﺎﺷﯿﻢ‪.‬‬
‫ﺑﺎﺷﺪ ﺗﺎ از ﻃﺮﯾﻖ آن ﺗﻤﺎﯾﺰ ﺑﯿﻦ وﺿﻌﯿﺖﻫﺎي دﻧﯿﺎ ﮐﻪ در ﻇﺎﻫﺮ ورودي ادراﮐﯽ ﯾﮑﺴﺎﻧﯽ‬
‫دوم‪ :‬ﻧﯿﺎزﻣﻨﺪ اﻃﻼﻋﺎت درﺑﺎره اﻋﻤﺎل ﺧﻮد ﻫﺴﺘﯿﻢ ﮐﻪ ﺑﺮ روي دﻧﯿﺎ اﺛﺮﮔﺬار اﺳﺖ‪.‬‬
‫ﻣﯽﮐﻨﻨﺪ وﻟﯽ در واﻗﻊ ﻣﻌﻨﯽ ﮐﺎﻣﻼً ﻣﺘﻔﺎوﺗﯽ دارﻧﺪ را ﻣﯿﺴﺮ ﺳﺎزد‪.‬‬

‫‪٨‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل )ﺣﺎﻓﻈﻪ دار(‬ ‫ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬
‫‪33‬‬ ‫‪34‬‬

‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﺳﺎده در ﺻﻮرﺗﯽ ﮐﺎر ﻣﯽ ﮐﻨﺪ ﮐﻪ ﻣﺤﯿﻂ ﮐﺎﻣﻼ ﻗﺎﺑﻞ‬ ‫‪‬‬
‫‪State‬‬
‫‪Sensors‬‬
‫ﻣﺸﺎﻫﺪه ﺑﺎﺷﺪ‬
‫‪What the world‬‬
‫اﮔﺮ ﻣﺤﯿﻂ ﻣﺸﺎﻫﺪه ﭘﺬﯾﺮ ﺟﺰﺋﯽ ﺑﺎﺷﺪ‪ ،‬ﭘﯿﮕﯿﺮي ﺗﻐﯿﯿﺮات دﻧﯿﺎ ﻻزم اﺳﺖ‬ ‫‪‬‬ ‫‪How the world evolves‬‬
‫‪is like now‬‬

‫‪Environment‬‬
‫ﻣﺜﺎل‪ :‬ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬ ‫‪What my actions do‬‬
‫ﻣﺴﺘﻠﺰم دو ﻧﻮع داﻧﺶ‬ ‫‪‬‬

‫‪ ‬ﻧﺤﻮه ﺗﻐﯿﯿﺮ دﻧﯿﺎ‬


‫‪What action I‬‬
‫‪ ‬ﺗﺎﺛﯿﺮ اﻋﻤﺎل ﻋﺎﻣﻞ ﺑﺮ دﻧﯿﺎ‬ ‫‪Condition-action rules‬‬
‫‪should do now‬‬

‫‪Agent‬‬ ‫‪Actuators‬‬

‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف‬


‫‪35‬‬ ‫‪36‬‬

‫‪function REFLEX-AGENT-WITH-STATE( percept) returns an action‬‬ ‫ﻋﺎﻣﻞﻫﺎي ﻫﺪف ﮔﺮا‪:‬‬


‫‪static: state, a description of the current world state‬‬
‫‪rules, a set of condition-action rules‬‬
‫‪action, the most recent action, initially none‬‬ ‫داﻧﺴﺘﻦ درﺑﺎره وﺿﻌﯿﺖ ﮐﻨﻮﻧﯽ ﻣﺤﯿﻂ ﻫﻤﻮاره ﺑﺮاي ﺗﺼﻤﯿﻢﮔﯿﺮي ﻋﻤﻞ ﻧﻤﯽﺗﻮاﻧﺪ ﮐﺎﻓﯽ‬
‫ﺑﺎﺷﺪ‪.‬‬
‫)‪state  UPDATE-STATE( state, action, percept‬‬
‫ﺑﻪ ﻫﻤﺎن ﮔﻮﻧﻪ ﮐﻪ ﻋﺎﻣﻞ ﻧﯿﺎزﻣﻨﺪ ﺷﺮح وﺿﻌﯿﺖ ﺟﺎري اﺳﺖ‪ ،‬ﺑﻪ ﻧﻮﻋﯽ ﻧﯿﺎزﻣﻨﺪ اﻃﻼﻋﺎت‬
‫)‪rule  RULE-MATCH( state, rules‬‬
‫ﻫﺪف)‪ (goal‬ﻣﯽﺑﺎﺷﺪ ﮐﻪ ﺗﻮﺿﯿﺢ ﻣﻮﻗﻌﯿﺖ ﻣﻄﻠﻮب اﺳﺖ‪.‬‬
‫]‪action  RULE-ACTION[ rule‬‬
‫‪return action‬‬

‫‪٩‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬


‫‪37‬‬ ‫‪38‬‬

‫ﺗﻔﺎوت ﻋﺎﻣﻞﻫﺎي واﮐﻨﺸﯽ و ﻫﺪفﮔﺮا‪:‬‬


‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻣﯽﺗﻮاﻧﺪ اﯾﻦ اﻃﻼﻋﺎت را ﺑﺎ اﻃﻼﻋﺎﺗﯽ درﺑﺎره ﻧﺘﺎﯾﺞ اﻋﻤﺎل ﻣﻤﮑﻦ )ﻫﻤﺎﻧﻨﺪ‬
‫در ﻃﺮاﺣﯽ ﻋﺎﻣﻞﻫﺎي واﮐﻨﺸﯽ ﻃﺮاح ﺑﺮاي ﺣﺎﻻت ﻣﺘﻔﺎوت ﻋﻤﻠﯽ درﺳﺖ را ﭘﯿﺶ ﻣﺤﺎﺳﺒﻪ‬
‫اﻃﻼﻋﺎﺗﯽ ﮐﻪ در ﻋﺎﻣﻞ واﮐﻨﺶ ﺑﺮاي ﺑﻬﻨﮕﺎمﺳﺎزي وﺿﻌﯿﺖ داﺧﻠﯽ اﺳﺘﻔﺎده ﺷﺪ( ﺗﺮﮐﯿﺐ‬
‫ﻣﯽﮐﻨﺪ‪ .‬در ﻋﺎﻣﻞﻫﺎي‬
‫ﻧﻤﻮده ﺗﺎ اﻋﻤﺎل ﻣﻨﺎﺳﺐ را ﺑﺮاي دﺳﺘﺮﺳﯽ ﺑﻪ ﻫﺪف اﻧﺘﺨﺎب ﻧﻤﺎﯾﺪ‪.‬‬
‫ﻫﺪفﮔﺮا‪ ،‬ﻋﺎﻣﻞ ﻣﯽﺗﻮاﻧﺪ داﻧﺶ ﺧﻮد را در ﻣﻮرد ﭼﮕﻮﻧﮕﯽ واﮐﻨﺶ ﺑﻬﻨﮕﺎم ﺳﺎزد‪.‬‬
‫در ﻣﻮاﻗﻌﯽ ﺳﺎده اﺳﺖ‪ :‬ﮐﻪ رﺿﺎﯾﺖ از ﻫﺪف ﺑﻼﻓﺎﺻﻠﻪ از ﻋﻤﻞ واﺣﺪ ﺗﻮﻟﯿﺪ ﮔﺮدد‪.‬‬
‫‪ .١‬ﺑﺮاي ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺎ ﻣﺠﺒﻮر ﺑﻪ دوﺑﺎره ﻧﻮﯾﺴﯽ ﺗﻌﺪاد زﯾﺎدي ﻗﻮاﻧﯿﻦ ﺷﺮط –ﻋﻤﻞ‬
‫در ﻣﻮاﻗﻌﯽ ﭘﯿﭽﯿﺪه اﺳﺖ‪ :‬ﮐﻪ ﻋﺎﻣﻞ ﺑﺎﯾﺪ دﻧﺒﺎﻟﻪﻫﺎي ﻃﻮﻻﻧﯽ را در ﻧﻈﺮﮔﺮﻓﺘﻪ ﺗﺎ راﻫﯽ‬
‫ﺧﻮاﻫﯿﻢ ﺑﻮد‪.‬‬
‫ﺑﺮاي دﺳﺘﯿﺎﺑﯽ ﺑﻪ ﻫﺪف ﭘﯿﺪا ﮐﻨﺪ‪.‬‬
‫‪ .٢‬ﻋﺎﻣﻞ ﻫﺪفﮔﺮا ﻧﺴﺒﺖ ﺑﻪ رﺳﯿﺪن ﺑﻪ ﻣﻘﺎﺻﺪ ﻣﺘﻔﺎوت اﻧﻌﻄﺎف ﭘﺬﯾﺮ اﺳﺖ‪.‬‬
‫‪ .٣‬ﺑﺴﺎدﮔﯽ ﺑﺎ ﺗﻌﯿﯿﻦ ﯾﮏ ﻫﺪف ﺗﺎزه‪ ،‬ﻣﯽﺗﻮاﻧﯿﻢ ﻋﺎﻣﻞ ﻫﺪفﮔﺮا را ﺑﻪ رﻓﺘﺎر ﺗﺎزه ﺑﺮﺳﺎﻧﯿﻢ‪.‬‬
‫در ﻣﻮاﻗﻊ ﭘﯿﭽﯿﺪه‪ ،‬ﺟﺴﺘﺠﻮ و ﺑﺮﻧﺎﻣﻪرﯾﺰي ﺑﻪ ﯾﺎﻓﺘﻦ دﻧﺒﺎﻟﻪ اﻋﻤﺎل ﻣﻨﺠﺮ ﺧﻮاﻫﻨﺪ ﺷﺪ‪.‬‬

‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف‬


‫‪39‬‬ ‫‪40‬‬

‫‪Sensors‬‬
‫‪State‬‬
‫اﻃﻼﻋﺎت ﻻزم ﺑﺮاي ﺗﺼﻤﯿﻢ ﮔﯿﺮي در ﻣﻮرد ﻋﻤﻠﯽ ﮐﻪ ﺑﺎﯾﺪ اﻧﺠﺎم ﺷﻮد‪:‬‬ ‫‪‬‬
‫‪What the world‬‬
‫‪ ‬اﻃﻼﻋﺎت ﻣﺮﺑﻮط ﺑﻪ ﺣﺎﻟﺖ ﻓﻌﻠﯽ‬ ‫‪How the world evolves‬‬
‫‪is like now‬‬

‫‪Environment‬‬
‫‪ ‬اﻃﻼﻋﺎت ﻫﺪف )ﺗﻮﺻﯿﻒ ﻣﻮﻗﻌﯿﺖ ﻣﻄﻠﻮب(‬
‫‪What my actions do‬‬
‫‪ ‬ﻣﺜﺎل‪ :‬ﻋﻤﻞ ﻣﻨﺎﺳﺐ ﺑﺮاي ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ در ﯾﮏ ﭼﻬﺎر راه ﮐﺪام اﺳﺖ؟‬ ‫‪What it will be like‬‬
‫)ﺑﺎﻻ‪ ،‬ﭘﺎﯾﯿﻦ ﭼﭗ‪ ،‬راﺳﺖ(‬ ‫‪if I do action A‬‬

‫اﮔﺮ ﺑﺮاي رﺳﯿﺪن ﺑﻪ ﻫﺪف ﻧﯿﺎز ﺑﻪ ﭼﻨﺪﯾﻦ ﻋﻤﻞ ﺑﺎﺷﺪ‬ ‫‪‬‬


‫‪What action I‬‬
‫‪ ‬ﺟﺴﺘﺠﻮ )‪(search‬‬ ‫‪Goals‬‬
‫‪should do now‬‬
‫‪ ‬ﺑﺮﻧﺎﻣﻪ رﯾﺰي )‪(planning‬‬
‫‪Agent‬‬ ‫‪Actuators‬‬

‫‪١٠‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي)اداﻣﻪ‪(...‬‬


‫‪41‬‬ ‫‪42‬‬

‫ﻋﺎﻣﻞﻫﺎي ﺳﻮدﻣﻨﺪ‪:‬‬ ‫ﺳﻮدﻣﻨﺪي‪ :‬ﺗﺎﺑﻌﯽ اﺳﺖ ﮐﻪ ﯾﮏ وﺿﻌﯿﺖ را ﺑﻪ ﻋﺪد ﺣﻘﯿﻘﯽ ﻧﮕﺎﺷﺖ ﻣﯽدﻫﺪ‪ ،‬ﮐﻪ درﺟﻪ‬
‫رﺿﺎﯾﺖ ﻣﺮﺑﻮط را ﺗﺸﺮﯾﺢ ﻣﯽﮐﻨﺪ‪.‬‬

‫‪ ‬اﻫﺪاف ﺑﻪ ﺗﻨﻬﺎﯾﯽ ﺑﺮاي ﺗﻮﻟﯿﺪ رﻓﺘﺎر ﺑﺎ ﮐﯿﻔﯿﺖ ﺑﺎﻻ ﮐﺎﻓﯽ ﻧﯿﺴﺘﻨﺪ‪.‬‬ ‫ﻣﺸﺨﺼﺎت ﮐﺎﻣﻞ ﺗﺎﺑﻊ ﺳﻮدﻣﻨﺪي اﻣﮑﺎن ﺗﺼﻤﯿﻢﮔﯿﺮي ﻣﻨﻄﻘﯽ را ﺑﺮاي دو ﻧﻮع ﺣﺎﻟﺘﯽ ﮐﻪ‬
‫ﻫﺪف ﻣﺸﮑﻞ دارد‪ ،‬اﺟﺎزه ﻣﯽدﻫﺪ‪.‬‬
‫‪ ‬ﻣﻼك ﮐﺎراﯾﯽ ﻋﻮﻣﯽ ﺑﺎﯾﺪ ﻣﻘﺎﯾﺴﻪاي ﺑﯿﻦ وﺿﻌﯿﺖﻫﺎي دﻧﯿﺎي ﻣﺘﻔﺎوت )ﯾﺎ دﻧﺒﺎﻟﻪ ﺣﺎﻻت(‬
‫را ﺑﺮ ﭘﺎﯾﻪ ﭼﮕﻮﻧﮕﯽ رﺿﺎﯾﺖ ﻋﺎﻣﻞ در ﺻﻮرت ﺣﺼﻮل ﻫﺪف ﺑﺪﻫﺪ‪.‬‬ ‫‪ .١‬زﻣﺎﻧﯽ ﮐﻪ اﻫﺪاف ﻣﺘﻨﺎﻗﺺ وﺟﻮد دارﻧﺪ‪.‬‬

‫‪ ‬ﺑﻨﺎﺑﺮاﯾﻦ اﮔﺮ ﯾﮏ وﺿﻌﯿﺖ دﻧﯿﺎ ﺑﻪ دﯾﮕﺮي ﺗﺮﺟﯿﺢ داده ﻣﯽﺷﻮد‪ ،‬آﻧﮕﺎه آن ﺑﺮاي ﻋﺎﻣﻞ‬ ‫‪ .٢‬زﻣﺎﻧﯽ ﮐﻪ ﭼﻨﺪﯾﻦ ﻫﺪف دارﻧﺪ ﮐﻪ ﻋﺎﻣﻞ ﻣﯽﺗﻮاﻧﺪ آﻧﻬﺎ را ﻫﺪف ﻗﺮار دﻫﺪ و ﻫﯿﭽﮑﺪام از‬

‫ﺳﻮدﻣﻨﺪﺗﺮ ﺧﻮاﻫﺪ ﺑﻮد‬ ‫آﻧﻬﺎ ﺑﺎ ﻗﻄﻌﯿﺖ ﻗﺎﺑﻞ ﺣﺼﻮل ﻧﯿﺴﺖ‪.‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﺳﻮدﻣﻨﺪ‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي‬


‫‪43‬‬ ‫‪44‬‬
‫‪Sensors‬‬
‫در ﺑﺴﯿﺎري از ﻣﺤﯿﻂ ﻫﺎ اﻫﺪاف ﺑﺮاي ﺗﻮﻟﯿﺪ رﻓﺘﺎري ﺑﺎ ﮐﯿﻔﯿﺖ ﺑﺎﻻ ﻣﻨﺎﺳﺐ‬ ‫‪‬‬
‫‪State‬‬

‫ﻧﯿﺴﺘﻨﺪ‬ ‫‪What the world‬‬


‫‪How the world evolves‬‬
‫ﻣﺜﺎل‪ :‬ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬ ‫‪is like now‬‬
‫‪ ‬ﻣﻤﮑﻦ اﺳﺖ ﭼﻨﺪﯾﻦ ﻣﺴﯿﺮ ﺑﺮاي رﺳﯿﺪن ﺑﻪ ﻣﻘﺼﺪ ﻣﻮﺟﻮد ﺑﺎﺷﺪ‪ ،‬اﻣﺎ ﺑﻌﻀﯽ از آﻧﻬﺎ‬

‫‪Environment‬‬
‫‪What it will be like if‬‬
‫ﺳﺮﯾﻌﺘﺮ‪ ،‬اﻣﻦ ﺗﺮ‪ ،‬ﻣﻄﻤﺌﻦ ﺗﺮ و ﯾﺎ ارزاﻧﺘﺮ از ﺑﻘﯿﻪ ﻣﯽ ﺑﺎﺷﻨﺪ‬ ‫‪What my actions do‬‬
‫‪I do action A‬‬
‫اﻫﺪاف ﻣﻼﮐﯽ ﺧﺎم ﺑﺮاي ﺗﻮﺻﯿﻒ وﺿﻌﯿﺖ ﻫﺎ ﻫﺴﺘﻨﺪ )ﻣﻄﻠﻮب و ﻧﺎﻣﻄﻠﻮب(‬ ‫‪‬‬

‫ﺗﺎﺑﻊ ﺳﻮدﻣﻨﺪي‪ :‬ﺣﺎﻟﺖ ) ﯾﺎ دﻧﺒﺎﻟﻪ اي از ﺣﺎﻻت( را ﺑﻪ ﯾﮏ ﻋﺪد ﺣﻘﯿﻘﯽ‬ ‫‪‬‬ ‫‪Utility‬‬


‫‪How happy I will be‬‬
‫ﻧﮕﺎﺷﺖ ﻣﯽ ﮐﻨﺪ ﮐﻪ درﺟﻪ ﻣﻄﻠﻮﺑﯿﺖ آن را ﺗﻮﺻﯿﻒ ﻣﯽ ﮐﻨﺪ‬ ‫‪in such a state‬‬

‫اﻣﮑﺎن ﺗﺼﻤﯿﻢ ﮔﯿﺮي در ﻣﻮاردي ﮐﻪ‪:‬‬ ‫‪‬‬ ‫‪What action I‬‬


‫‪ ‬اﻫﺪاف ﻣﺘﻨﺎﻗﺾ ﺑﺎﺷﻨﺪ‬ ‫‪should do now‬‬
‫‪ ‬ﭼﻨﺪﯾﻦ ﻫﺪف وﺟﻮد دارد وﻟﯽ رﺳﯿﺪن ﺑﻪ ﻫﯿﭻ ﯾﮏ ﻗﻄﻌﯽ ﻧﯿﺴﺖ‬ ‫‪Agent‬‬
‫‪Actuators‬‬

‫‪١١‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه‬


‫‪45‬‬ ‫‪46‬‬

‫ﺗﻮرﯾﻨﮓ )‪ :(1950‬اﯾﺪه ﺑﺮﻧﺎﻣﻪ ﻧﻮﯾﺴﯽ واﻗﻌﯽ ﻫﻮﺷﻤﻨﺪ ﺑﻪ ﺻﻮرت دﺳﺘﯽ‬ ‫‪‬‬ ‫اﻧﻮاع داﻧﺸﯽ ﮐﻪ ﻋﻨﺼﺮ ﯾﺎدﮔﯿﺮﻧﺪه ﻣﯽ ﺗﻮاﻧﺪ ﯾﺎد ﺑﮕﯿﺮد‪:‬‬ ‫‪‬‬
‫‪ ‬ﻧﯿﺎز ﺑﻪ روش ﻫﺎي ﺳﺮﯾﻌﺘﺮ‬
‫‪ ‬ﯾﺎدﮔﯿﺮي ﻣﺴﺘﻘﯿﻢ از دﻧﺒﺎﻟﻪ ادراﮐﯽ‬
‫‪ ‬ﺳﺎﺧﺖ ﻣﺎﺷﯿﻦ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه و آﻣﻮزش ﺑﻪ آﻧﻬﺎ‬
‫ﻣﻮﻟﻔﻪ ﻫﺎي ﻋﺎﻣﻞ ﯾﺎدﮔﯿﺮﻧﺪه‬ ‫‪‬‬ ‫‪ ‬ﯾﺎدﮔﯿﺮي ﻧﺤﻮه ﺗﻐﯿﯿﺮات دﻧﯿﺎ‪ :‬ﻣﺸﺎﻫﺪه دو ﺣﺎﻟﺖ ﻣﺘﻮاﻟﯽ‬
‫ﻋﻨﺼﺮ ﯾﺎدﮔﯿﺮﻧﺪه ‪ :‬ﺑﺮاي اﯾﺠﺎد ﺑﻬﺒﻮد‬ ‫‪‬‬ ‫‪ ‬ﯾﺎدﮔﯿﺮي در ﻣﻮرد ﺗﺎﺛﯿﺮ ﻋﻤﻞ ﻋﺎﻣﻞ‪ :‬ﻣﺸﺎﻫﺪه ﻧﺘﺎﯾﺞ ﻓﻌﺎﻟﯿﺖ ﻋﺎﻣﻞ‬
‫ﻋﻨﺼﺮ ﮐﺎرآﯾﯽ‪ :‬اﻧﺘﺨﺎب ﻓﻌﺎﻟﯿﺖ ﻫﺎي ﺧﺎرﺟﯽ‬ ‫‪‬‬
‫‪ ‬ﻣﺜﺎل‪ :‬ﻧﺤﻮه ﺗﺮﻣﺰ ﮐﺮدن در ﺟﺎده ﻫﺎي ﺧﯿﺲ‬
‫ﻣﻨﺘﻘﺪ‪ :‬ﺗﻮﻟﯿﺪ ﺑﺎزﺧﻮرد ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ اﺳﺘﺎﻧﺪارد ﮐﺎرآﯾﯽ ﺑﺮاي ﻋﻨﺼﺮ ﯾﺎدﮔﯿﺮﻧﺪه‬ ‫‪‬‬
‫ﻣﻮﻟﺪ ﻣﺴﺎﻟﻪ‪ :‬ﭘﯿﺸﻨﻬﺎد ﻓﻌﺎﻟﯿﺖ ﻫﺎي اﮐﺘﺸﺎﻓﯽ‬ ‫‪‬‬

‫ﻣﺜﺎل‪ :‬ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬ ‫ﭘﺎداش و ﺟﺮﯾﻤﻪ‬ ‫‪‬‬


‫ﻋﻨﺼﺮ ﮐﺎرآﯾﯽ‪ :‬ﺣﺮﮐﺖ ﺳﺮﯾﻊ از ﺧﻂ ‪ 3‬ﺑﻪ ﺧﻂ ‪1‬‬ ‫‪‬‬
‫ﻣﻨﺘﻘﺪ‪ :‬درﯾﺎﻓﺖ ﺷﮑﺎﯾﺖ راﻧﻨﺪه ﻫﺎي دﯾﮕﺮ‬ ‫‪‬‬

‫اﯾﺠﺎد ﻗﺎﻧﻮﻧﯽ ﺑﯿﺎﻧﮕﺮ ﺑﺪ ﺑﻮدن اﯾﻦ ﻋﻤﻞ و اﺻﻼح ﻋﻨﺼﺮ ﮐﺎرآﯾﯽ‬ ‫‪‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮي‬


‫‪Performance standard‬‬

‫‪47‬‬
‫‪Critic‬‬ ‫‪Sensors‬‬

‫‪feedback‬‬
‫‪Environment‬‬

‫‪changes‬‬
‫‪Learning‬‬ ‫‪Performance‬‬
‫‪element‬‬ ‫‪element‬‬
‫‪knowledge‬‬
‫‪learning‬‬
‫‪goals‬‬
‫‪Problem‬‬
‫‪generator‬‬

‫‪Agent‬‬ ‫‪Actuators‬‬

‫‪١٢‬‬

You might also like