AI-Chapter 2

‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﻫﻮش ﻣﺼﻨﻮﻋﯽ‬
‫‪Artificial Intelligence‬‬
‫ﻧﺎم ﮐﺘﺎب ‪ :‬ﻫﻮش ﻣﺼﻨﻮﻋﯽ رﻫﯿﺎﺗﯽ ﻧﻮﯾﻦ‬
‫ﻫﻮش ﻣﺼﻨﻮﻋﯽ‬
‫ﻣﻮﻟﻒ ‪ :‬راﺳﻞ و ﻧﻮروﯾﮓ‬
‫ﻓﺼﻞ دوم‪-‬ﻋﺎﻣﻠﻬﺎي ﻫﻮﺷﻤﻨﺪ‬
‫ﻣﻬﺪي ﺑﺎزرﮔﺎﻧﯽ‬
‫داﻧﺸﮕﺎه آزاد اﺳﻼﻣﯽ زﻧﺠﺎن‬
‫‪http://mbzir.com‬‬ ‫‪, http://csiz.ir‬‬

‫‪.‬‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻋﺎﻣﻞ ﻫﺎ‬

‫‪3‬‬ ‫‪4‬‬
‫ﻋﺎﻣﻞ ﻫﺎ و ﻣﺤﯿﻂ ﻫﺎ‬ ‫‪‬‬ ‫ﻋﺎﻣﻞ‪ :‬ﻫﺮ ﭼﯿﺰي ﮐﻪ ﺑﺘﻮاﻧﺪ ﻣﺤﯿﻂ ﭘﯿﺮاﻣﻮﻧﺶ را از ﻃﺮﯾﻖ ﺣﺴﮕﺮﻫﺎ درك‬ ‫‪‬‬
‫ﻋﻘﻼﻧﯽ ﺑﻮدن‬ ‫‪‬‬ ‫ﮐﻨﺪ و در آن ﻣﺤﯿﻂ از ﻃﺮﯾﻖ اﺛﺮﮐﻨﻨﺪه ﻫﺎ ﻋﻤﻞ ﮐﻨﺪ‪.‬‬

‫‪)PEAS‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ ،‬ﻣﺤﯿﻂ‪ ،‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ ،‬ﺣﺴﮕﺮﻫﺎ(‬ ‫‪‬‬ ‫ﻋﺎﻣﻞ اﻧﺴﺎﻧﯽ‪:‬‬ ‫‪‬‬
‫اﻧﻮاع ﻣﺤﯿﻂ ﻫﺎ‬ ‫‪‬‬

‫‪ ‬ﭼﺸﻢ ﻫﺎ و ﮔﻮش ﻫﺎ و ﺳﺎﯾﺮ اﻧﺪام ﻫﺎي ﺣﺴﯽ ﺑﻪ ﻋﻨﻮان ﺣﺴﮕﺮﻫﺎ‬
‫‪ ‬دﺳﺖ ﻫﺎ‪ ،‬ﭘﺎﻫﺎ‪ ،‬دﻫﺎن و ﺳﺎﯾﺮ اﻋﻀﺎي ﺑﺪن ﺑﻪ ﻋﻨﻮان اﺛﺮ ﮐﻨﻨﺪه ﻫﺎ‬
‫اﻧﻮاع ﻋﺎﻣﻞ ﻫﺎ‬ ‫‪‬‬
‫ﻋﺎﻣﻞ روﺑﺎت‪:‬‬ ‫‪‬‬
‫‪ ‬دورﺑﯿﻦ ﻫﺎ و ﻓﺎﺻﻠﻪ ﯾﺎب ﻣﺎدون ﻗﺮﻣﺰ ﺑﻪ ﻋﻨﻮان ﺣﺴﮕﺮﻫﺎ‬

‫‪ ‬اﻧﻮاع ﻣﻮﺗﻮرﻫﺎ ﺑﻪ ﻋﻨﻮان اﺛﺮ ﮐﻨﻨﺪه ﻫﺎ‬
‫‪١‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﻋﺎﻣﻞ ﻫﺎ و ﻣﺤﯿﻂ ﻫﺎ‬ ‫دﻧﯿﺎي ﺟﺎرو ﺑﺮﻗﯽ‬

‫‪5‬‬ ‫‪6‬‬
‫ﺗﺎﺑﻊ ﻋﺎﻣﻞ ﺗﺎرﯾﺨﭽﻪ ادراﮐﯽ را ﺑﻪ اﻋﻤﺎل ﻧﮕﺎﺷﺖ ﻣﯽ ﮐﻨﺪ‪:‬‬ ‫‪‬‬
‫]‪[f: P*  A‬‬
‫ادراك ﻫﺎ‪ :‬ﻣﮑﺎن ﻫﺎ و ﻣﺤﺘﻮﯾﺎت آﻧﻬﺎ‪ ،‬ﻣﺎﻧﻨﺪ ]‪[A, Dirty‬‬ ‫‪‬‬
‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﺑﺮاي اﯾﺠﺎد ‪ f‬ﺑﺮ روي ﻣﻌﻤﺎري ﻓﯿﺰﯾﮑﯽ اﺟﺮا ﻣﯽ ﺷﻮد‪.‬‬ ‫‪‬‬
‫ﻋﺎﻣﻞ = ﻣﻌﻤﺎري ‪ +‬ﺑﺮﻧﺎﻣﻪ‬ ‫‪‬‬

‫اﻋﻤﺎل‪ :‬ﺣﺮﮐﺖ ﺑﻪ ﭼﭗ و راﺳﺖ‪ ،‬ﻣﮑﺶ و ‪NoOp‬‬ ‫‪‬‬
‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ اﯾﺪه آل‬

‫‪7‬‬ ‫‪8‬‬
‫ﯾﮏ ﻋﺎﻣﻞ ﺑﺎﯾﺪ ﺑﺮ اﺳﺎس آﻧﭽﻪ ﮐﻪ ﻣﯽ ﺗﻮاﻧﺪ درك ﮐﻨﺪ و اﻋﻤﺎﻟﯽ ﮐﻪ ﻣﯽ ﺗﻮاﻧﺪ‬ ‫‪‬‬
‫اﻧﺠﺎم دﻫﺪ‪» ،‬ﮐﺎر درﺳﺖ را اﻧﺠﺎم دﻫﺪ«‪ .‬ﻋﻤﻞ درﺳﺖ آن اﺳﺖ ﮐﻪ ﺑﺎﻋﺚ ﺷﻮد‬ ‫ﻋﺎﻣﻞ ﻋﻘﻼﻧﯽ اﯾﺪه آل‪ :‬ﺑﺮاي ﻫﺮ دﻧﺒﺎﻟﻪ ادراﮐﯽ ﻣﻤﮑﻦ‪ ،‬ﯾﮏ ﻋﺎﻣﻞ ﻋﻘﻼﻧﯽ‬ ‫‪‬‬
‫ﻋﺎﻣﻞ ﺑﯿﺸﺘﺮﯾﻦ ﻣﻮﻓﻘﯿﺖ را ﺑﺪﺳﺖ آورد‪.‬‬ ‫ﺑﺎﯾﺪ ﺑﺮ اﺳﺎس ﺷﻮاﻫﺪ درﯾﺎﻓﺘﯽ از دﻧﺒﺎﻟﻪ ادراﮐﯽ و داﻧﺶ دروﻧﯽ‪ ،‬ﻋﻤﻠﯽ‬
‫ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬ﯾﮏ ﻣﻌﯿﺎر ﻫﺪف ﺑﺮاي ﺳﻨﺠﺶ ﻣﯿﺰان ﻣﻮﻓﻘﯿﺖ رﻓﺘﺎر ﯾﮏ ﻋﺎﻣﻞ‬ ‫‪‬‬ ‫را اﻧﺘﺨﺎب ﮐﻨﺪ ﮐﻪ اﻧﺘﻈﺎر ﻣﯽ رود ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ اش را ﺑﻪ ﺣﺪاﮐﺜﺮ‬
‫ﻣﺜﺎل‪ :‬ﻣﻌﯿﺎر ﻣﻮﻓﻘﯿﺖ ﻋﺎﻣﻞ دﻧﯿﺎي ﺟﺎرو ﺑﺮﻗﯽ‪:‬‬ ‫‪‬‬ ‫ﺑﺮﺳﺎﻧﺪ‪.‬‬
‫‪ ‬ﻣﻘﺪار ﮔﺮد و ﺧﺎك ﺗﻤﯿﺰ ﺷﺪه‬
‫‪ ‬ﻣﯿﺰان زﻣﺎن ﻣﺼﺮف ﺷﺪه‬
‫‪ ‬ﻣﻘﺪار ﺑﺮق ﻣﺼﺮف ﺷﺪه‬
‫‪ ‬ﻣﯿﺰان ﺳﺮ و ﺻﺪاي ﺗﻮﻟﯿﺪ ﺷﺪه و ‪...‬‬
‫‪٢‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ‬ ‫‪PEAS‬‬

‫‪9‬‬ ‫‪10‬‬
‫‪PEAS: Performance measure, Environment, Actuators, Sensors‬‬ ‫‪‬‬

‫ﻋﻘﻼﻧﯽ ﺑﻮدن ﺑﺎ داﻧﺶ ﮐﻞ ﺑﻮدن ) داﻧﺴﺘﻦ ﻫﻤﻪ ﭼﯿﺰ ﺗﻮﺳﻂ داﻧﺶ‬ ‫‪‬‬ ‫در ﻃﺮاﺣﯽ ﯾﮏ ﻋﺎﻣﻞ اﺑﺘﺪا ﺑﺎﯾﺪ ﻣﻮارد ﺑﺎﻻ ﺗﻌﯿﯿﻦ ﮔﺮدﻧﺪ‪.‬‬ ‫‪‬‬
‫ﻧﺎﻣﺤﺪود( ﺗﻔﺎوت دارد‪.‬‬
‫ﻣﺜﺎل‪ :‬ﻃﺮاﺣﯽ ﯾﮏ راﻧﻨﺪه ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬
‫ﻋﺎﻣﻞ ﻣﯽ ﺗﻮاﻧﺪ اﻋﻤﺎﻟﯽ را اﻧﺠﺎم دﻫﺪ ﮐﻪ از ﻃﺮﯾﻖ ﺗﻐﯿﯿﺮ در ادراك ﻫﺎي‬ ‫‪‬‬
‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬اﻣﻨﯿﺖ‪ ،‬ﺳﺮﻋﺖ‪ ،‬راﺣﺘﯽ‪ ،‬ﺳﻮد و ‪...‬‬
‫آﺗﯽ اﻃﻼﻋﺎت ﻣﻔﯿﺪ ﺑﺪﺳﺖ آورد )ﺟﻤﻊ آوري داﻧﺶ‪ ،‬اﮐﺘﺸﺎف(‬
‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﺧﯿﺎﺑﺎن ﻫﺎ‪ ،‬اﻓﺮاد ﭘﯿﺎده‪ ،‬ﻣﺸﺘﺮي ﻫﺎ و ‪...‬‬
‫ﯾﮏ ﻋﺎﻣﻞ ﺧﻮدﻣﺨﺘﺎر اﺳﺖ اﮔﺮ رﻓﺘﺎرش ﺑﺮ اﺳﺎس ﺗﺠﺮﺑﻪ اش ﺗﻌﯿﯿﻦ‬ ‫‪‬‬
‫‪ ‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ :‬ﻓﺮﻣﺎن‪ ،‬ﺷﺘﺎب دﻫﻨﺪه‪ ،‬ﺗﺮﻣﺰﻫﺎ‪ ،‬ﺑﻮق‪ ،‬ﭼﺮاغ ﻫﺎ و ‪...‬‬
‫ﺷﻮد ) ﺑﻪ ﻫﻤﺮاه ﻗﺎﺑﻠﯿﺖ ﯾﺎدﮔﯿﺮي و ﺗﻄﺒﯿﻖ ﭘﺬﯾﺮي(‬ ‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬دورﺑﯿﻦ ﻫﺎ‪ ،‬ﺣﺴﮕﺮﻫﺎي ﺻﻮﺗﯽ )‪ ،(Sonar‬ﺳﺮﻋﺖ ﺳﻨﺞ‪،GPS ،‬‬
‫ﮐﯿﻠﻮﻣﺘﺮ ﺷﻤﺎر‪ ،‬ﺣﺴﮕﺮﻫﺎي ﻣﻮﺗﻮر‪ ،‬ﺻﻔﺤﻪ ﮐﻠﯿﺪ‪ ،‬ﻣﯿﮑﺮوﻓﻮن و ‪...‬‬
‫‪PEAS‬‬ ‫‪PEAS‬‬
‫‪11‬‬ ‫‪12‬‬
‫ﻋﺎﻣﻞ‪ :‬ﺳﯿﺴﺘﻢ ﺗﺸﺨﯿﺺ ﭘﺰﺷﮑﯽ‬ ‫‪‬‬ ‫ﻋﺎﻣﻞ‪ :‬روﺑﺎت ﺟﺎﺑﻪ ﺟﺎ ﮐﻨﻨﺪه اﺷﯿﺎء‬ ‫‪‬‬
‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬ﺳﻼﻣﺘﯽ ﺑﯿﻤﺎر‪ ،‬ﺑﻪ ﺣﺪاﻗﻞ رﺳﺎﻧﺪن ﻫﺰﯾﻨﻪ و ‪...‬‬ ‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬درﺻﺪ ﻗﻄﻌﺎﺗﯽ ﮐﻪ در ﺻﻨﺪوق درﺳﺖ ﻗﺮار ﻣﯽ ﮔﯿﺮﻧﺪ‬
‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﺑﯿﻤﺎر‪ ،‬ﺑﯿﻤﺎرﺳﺘﺎن‪ ،‬ﮐﺎرﻣﻨﺪان و ‪...‬‬ ‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﻧﻮار ﻧﻘﺎﻟﻪ و اﺷﯿﺎء روي آن‪ ،‬ﺻﻨﺪوق ﻫﺎ‬
‫‪ ‬اﺛﺮ ﮐﻨﻨﺪه ﻫﺎ‪ :‬ﺻﻔﺤﻪ ﻧﻤﺎﯾﺶ )ﭘﺮﺳﺶ ﻫﺎ‪ ،‬آزﻣﺎﯾﺶ ﻫﺎ‪ ،‬ﺗﺸﺨﯿﺺ ﻫﺎ‪ ،‬ﻣﺪاوا(‬ ‫‪ ‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ :‬ﺑﺎزوﻫﺎ و دﺳﺖ‬
‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬ﺻﻔﺤﻪ ﮐﻠﯿﺪ ) درﯾﺎﻓﺖ ﻋﻼﯾﻢ‪ ،‬ﯾﺎﻓﺘﻪ ﻫﺎ و ﭘﺎﺳﺦ ﻫﺎي ﺑﯿﻤﺎر(‬ ‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬دورﺑﯿﻦ‪ ،‬ﺣﺴﮕﺮ زاوﯾﻪ ﻣﻔﺎﺻﻞ‬
‫‪٣‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫‪PEAS‬‬ ‫ﻣﺤﯿﻂ‬
‫‪13‬‬ ‫‪14‬‬
‫ﻫﺮ ﻣﺤﯿﻂ داراي ﻣﺠﻤﻮﻋﻪ اي از ﺣﺎﻟﺖ ﻫﺎ ﻣﯽ ﺑﺎﺷﺪ‪:‬‬ ‫‪‬‬
‫آﻣﻮزش دﻫﻨﺪه زﺑﺎن ﺑﻪ ﺻﻮرت ﻣﺤﺎوره اي‬ ‫‪‬‬ ‫‪ ‬ﻣﺤﯿﻂ در ﻫﺮ ﻟﺤﻈﻪ ﻓﻘﻂ در ﯾﮑﯽ از اﯾﻦ ﺣﺎﻟﺖ ﻫﺎ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬
‫‪ ‬ﻣﻌﯿﺎر ﮐﺎرآﯾﯽ‪ :‬ﺑﻪ ﺣﺪاﮐﺜﺮ رﺳﺎﻧﺪن ﻧﻤﺮه داﻧﺶ آﻣﻮز در اﻣﺘﺤﺎن‬
‫‪ ‬ﻣﺤﯿﻂ‪ :‬ﻣﺠﻤﻮﻋﻪ داﻧﺶ آﻣﻮزان‬ ‫ﻣﺜﺎل‪ :‬دﻧﯿﺎي ﻣﮑﺶ‬ ‫‪‬‬
‫‪ ‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ :‬ﺻﻔﺤﻪ ﻧﻤﺎﯾﺶ )ﺗﻤﺮﯾﻦ ﻫﺎ‪ ،‬ﭘﯿﺸﻨﻬﺎدات و اﺻﻼﺣﺎت(‬

‫‪ ‬ﺣﺴﮕﺮﻫﺎ‪ :‬ﺻﻔﺤﻪ ﮐﻠﯿﺪ‬
‫}‪S = {1, 2, 3, 4, 5, 6, 7, 8‬‬
‫ﻋﺎﻣﻞ و ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬

‫‪15‬‬ ‫‪16‬‬
‫در ﻟﺤﻈﻪ ﺷﺮوع‪ ،‬ﻣﺤﯿﻂ در ﯾﮑﯽ از ﺣﺎﻟﺖ ﻫﺎي ﻣﻤﮑﻦ ﻣﯽ ﺑﺎﺷﺪ‬ ‫‪‬‬ ‫ﮐﺎﻣﻼ ﻗﺎﺑﻞ ﻣﺸﺎﻫﺪه )در ﻣﻘﺎﺑﻞ ﻣﺸﺎﻫﺪه ﭘﺬﯾﺮ ﺟﺰﺋﯽ(‪ :‬ﻣﺤﯿﻄﯽ ﮐﻪ در آن‬ ‫‪‬‬
‫‪ ‬ﻋﻤﻞ ﻋﺎﻣﻞ در ﻣﺤﯿﻂ‪ ،‬ﺑﺎﻋﺚ ﺗﻐﯿﯿﺮ ﺣﺎﻟﺖ ﻣﺤﯿﻂ ﻣﯽ ﺷﻮد‬ ‫در ﻫﺮ ﻟﺤﻈﻪ از زﻣﺎن ﺣﺴﮕﺮﻫﺎي ﻋﺎﻣﻞ ﺑﻪ آن اﻣﮑﺎن دﺳﺘﯿﺎﺑﯽ ﺑﻪ ﺣﺎﻟﺖ‬
‫‪ ‬ﺣﺎﻟﺖ ﻓﻌﻠﯽ‪Si :‬‬ ‫ﮐﺎﻣﻞ ﻣﺤﯿﻂ را ﻣﯽ دﻫﻨﺪ‪.‬‬
‫‪Action‬‬ ‫‪ ‬ﻋﻤﻞ ﻋﺎﻣﻞ‪Action :‬‬
‫‪Si‬‬ ‫‪Sj‬‬ ‫‪ ‬ﺣﺎﻟﺖ ﺑﻌﺪي‪Sj :‬‬ ‫]‪[location, status‬‬ ‫ﻣﺜﺎل‪ :‬دﻧﯿﺎي ﻣﮑﺶ – ﺣﺴﮕﺮﻫﺎ‪:‬‬ ‫‪‬‬
‫‪ ‬ﺗﺸﺨﯿﺺ ﻣﮑﺎن ‪ :‬ﭼﭗ ﯾﺎ راﺳﺖ‬

‫ﻣﺜﺎل‪ :‬دﻧﯿﺎي ﻣﮑﺶ‬ ‫‪‬‬
‫‪ ‬ﺗﺸﺨﯿﺺ وﺿﻌﯿﺖ‪ :‬ﺗﻤﯿﺰ ﯾﺎ ﮐﺜﯿﻒ‬
‫‪SUCK‬‬ ‫] ]‪[ LEFT, [CLEAN, DIRTY‬‬
‫‪۴‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫اﻧﻮاع ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬

‫‪17‬‬ ‫‪18‬‬
‫ﻗﻄﻌﯽ‪) :‬در ﻣﻘﺎﺑﻞ اﺗﻔﺎﻗﯽ(‪ :‬ﺣﺎﻟﺖ ﺑﻌﺪي ﻣﺤﯿﻂ ﮐﺎﻣﻼ ﺑﻮﺳﯿﻠﻪ ﺣﺎﻟﺖ ﻓﻌﻠﯽ و‬ ‫‪‬‬ ‫اﭘﯿﺰودﯾﮏ )در ﻣﻘﺎﺑﻞ ﺗﺮﺗﯿﺒﯽ(‪ :‬ﺗﺠﺮﺑﻪ ﻋﺎﻣﻞ ﺑﻪ »دوره ﻫﺎي« ﻏﯿﺮﻗﺎﺑﻞ‬ ‫‪‬‬
‫ﻋﻤﻞ اﻧﺠﺎم ﺷﺪه ﺗﻮﺳﻂ ﻋﺎﻣﻞ ﻗﺎﺑﻞ ﺗﻌﯿﯿﻦ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬ ‫ﺗﺠﺰﯾﻪ ﺗﻘﺴﯿﻢ ﻣﯽ ﺷﻮد )ﻫﺮ دوره ﺷﺎﻣﻞ ادراك ﻋﺎﻣﻞ و ﺳﭙﺲ اﻧﺠﺎم ﯾﮏ‬
‫‪ ‬اﮔﺮ ﻣﺤﯿﻂ ﺑﻪ ﺟﺰ در ﻣﻮرد ﻋﻤﻞ ﻋﺎﻣﻞ ﻫﺎي دﯾﮕﺮ ﻗﻄﻌﯽ ﺑﺎﺷﺪ‪ ،‬آﻧﮕﺎه ﻣﺤﯿﻂ‬ ‫ﻋﻤﻞ ﻣﯽ ﺑﺎﺷﺪ( و اﻧﺘﺨﺎب ﻋﻤﻞ در ﻫﺮ دوره ﺗﻨﻬﺎ ﺑﻪ ﺧﻮد ﻫﻤﺎن دوره‬
‫اﺳﺘﺮاﺗﮋﯾﮏ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬ ‫ﺑﺴﺘﮕﯽ دارد‪.‬‬
‫‪SUCK‬‬
‫ﻣﺜﺎل‪ :‬روﺑﺎت ﮐﻨﺘﺮل ﮐﻨﻨﺪه ﮐﯿﻔﯿﺖ‬ ‫‪‬‬

‫‪Episode 1‬‬ ‫‪Episode 2‬‬ ‫‪Episode 3‬‬
‫اﺗﻔﺎﻗﯽ‬ ‫ﻗﻄﻌﯽ‬
‫‪SUCK‬‬
‫‪SUCK‬‬
‫‪3‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪2‬‬ ‫‪5‬‬ ‫‪4‬‬ ‫‪3‬‬
‫‪Accept‬‬ ‫‪Reject‬‬ ‫‪Accept‬‬

‫‪19‬‬ ‫‪20‬‬
‫اﯾﺴﺘﺎ )در ﻣﻘﺎﺑﻞ ﭘﻮﯾﺎ(‪ :‬ﻣﺤﯿﻂ در ﺣﯿﻦ ﺳﻨﺠﺶ ﻋﺎﻣﻞ )ﺑﺮاي اﻧﺘﺨﺎب ﻋﻤﻞ(‬ ‫‪‬‬ ‫ﮔﺴﺴﺘﻪ )در ﻣﻘﺎﺑﻞ ﭘﯿﻮﺳﺘﻪ(‪ :‬ﻣﺤﯿﻄﯽ ﮐﻪ در آن ﺗﻌﺪاد ﻣﺤﺪود و ﻣﺘﻤﺎﯾﺰي از‬ ‫‪‬‬
‫ﺗﻐﯿﯿﺮ ﻧﻤﯽ ﮐﻨﺪ‪ .‬اﮔﺮ ﺧﻮد ﻣﺤﯿﻂ ﺑﺎ ﮔﺬﺷﺖ زﻣﺎن ﺗﻐﯿﯿﺮ ﻧﮑﻨﺪ وﻟﯽ ﻣﻌﯿﺎر‬ ‫درك ﻫﺎ و ﻋﻤﻞ ﻫﺎي ﮐﺎﻣﻼ واﺿﺢ ﺗﻌﺮﯾﻒ ﺷﺪه ﺑﺎﺷﺪ‪.‬‬
‫ﮐﺎرآﯾﯽ ﻋﺎﻣﻞ ﺗﻐﯿﯿﺮ ﮐﻨﺪ‪ ،‬آﻧﮕﺎه ﻣﺤﯿﻂ ﻧﯿﻤﻪ ﭘﻮﯾﺎ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬
‫در ﻣﺤﯿﻂ ﮔﺴﺴﺘﻪ‪ ،‬ﻣﺠﻤﻮﻋﻪ ﺣﺎﻻت ﻣﺤﯿﻂ ﯾﮏ ﻣﺠﻤﻮﻋﻪ ﮔﺴﺴﺘﻪ ﻣﯽ ﺑﺎﺷﺪ و‬ ‫‪‬‬
‫ﺣﺎﻻت ﺑﺴﺎدﮔﯽ ﻗﺎﺑﻞ ﺗﻤﺎﯾﺰ ﻣﯽ ﺑﺎﺷﻨﺪ‪.‬‬
‫ﺳﻨﺠﺶ ﻣﺤﯿﻂ‬ ‫‪ ‬ﻣﺜﺎل‪ :‬ﻣﺤﯿﻂ دﻧﯿﺎي ﻣﮑﺶ‬
‫‪t‬‬ ‫’‪t‬‬ ‫‪State = {1, 2, …, 8} ‬‬
‫‪S‬‬ ‫‪S‬‬ ‫اﯾﺴﺘﺎ‬ ‫‪Action = {Left, Right, Suck, NoOp} ‬‬
‫‪Percept = {[Left, Clean], [Left, Dirty], [Right, Clean], …} ‬‬
‫‪S‬‬ ‫’‪S‬‬ ‫ﭘﻮﯾﺎ‬
‫‪۵‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬

‫‪21‬‬ ‫‪22‬‬
‫ﺗﮏ ﻋﺎﻣﻠﯽ )در ﺑﺮاﺑﺮ ﭼﻨﺪ ﻋﺎﻣﻠﯽ(‪ :‬ﯾﮏ ﻋﺎﻣﻞ ﺧﻮدش ﺑﻪ ﺗﻨﻬﺎﯾﯽ در ﻣﺤﯿﻂ‬ ‫‪‬‬ ‫راﻧﻨﺪﮔﯽ ﺗﺎﮐﺴﯽ‬ ‫ﺷﻄﺮﻧﺞ ﺑﺪون‬
‫ﺳﺎﻋﺖ‬
‫ﺷﻄﺮﻧﺞ ﺑﺎ ﺳﺎﻋﺖ‬
‫ﻋﻤﻞ ﻣﯽ ﮐﻨﺪ‪.‬‬ ‫ﺧﯿﺮ‬ ‫ﺑﻠﻪ‬ ‫ﺑﻠﻪ‬ ‫ﮐﺎﻣﻼ ﻗﺎﺑﻞ ﻣﺸﺎﻫﺪه‬

‫‪ ‬ﻣﺜﺎل‪ :‬ﻣﺤﯿﻂ ﻋﺎﻣﻞ ﺣﻞ ﮐﻨﻨﺪه ﺟﺪول ﮐﻠﻤﺎت ﻣﺘﻘﺎﻃﻊ و دﻧﯿﺎي ﻣﮑﺶ‬ ‫ﺧﯿﺮ‬ ‫اﺳﺘﺮاﺗﮋﯾﮏ‬ ‫اﺳﺘﺮاﺗﮋﯾﮏ‬ ‫ﻗﻄﻌﯽ‬
‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫دوره اي‬

‫ﭼﻨﺪ ﻋﺎﻣﻠﯽ‪ :‬ﺗﻌﺪادي ﻋﺎﻣﻞ ﮐﻪ ﺑﺎ ﯾﮑﺪﯾﮕﺮ در ﺗﻌﺎﻣﻞ ﻣﯽ ﺑﺎﺷﻨﺪ‪.‬‬ ‫‪‬‬ ‫ﺧﯿﺮ‬ ‫ﺑﻠﻪ‬ ‫ﻧﯿﻤﻪ ﭘﻮﯾﺎ‬ ‫اﯾﺴﺘﺎ‬
‫‪ ‬ﻣﺜﺎل‪ :‬ﺷﻄﺮﻧﺞ )رﻗﺎﺑﺘﯽ(‪ ،‬روﺑﻮﮐﺎپ )ﺑﯿﻦ اﻋﻀﺎي ﯾﮏ ﺗﯿﻢ ﻫﻤﯿﺎري و ﺑﯿﻦ اﻋﻀﺎي‬ ‫ﺧﯿﺮ‬ ‫ﺑﻠﻪ‬ ‫ﺑﻠﻪ‬ ‫ﮔﺴﺴﺘﻪ‬
‫دو ﺗﯿﻢ رﻗﺎﺑﺘﯽ(‪ ،‬ﻣﺤﯿﻂ ﺗﺎﮐﺴﯽ ﺧﻮدﮐﺎر )ﻫﻤﯿﯿﺎري ﺟﺰﯾﯽ(‬
‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫ﺗﮏ ﻋﺎﻣﻠﯽ‬
‫• ﻧﻮع ﻣﺤﯿﻂ ﺑﻪ ﻣﯿﺰان زﯾﺎدي ﺗﻌﯿﯿﻦ ﮐﻨﻨﺪه ﻃﺮاﺣﯽ ﻋﺎﻣﻞ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬

‫• دﻧﯿﺎي واﻗﻌﯽ‪ :‬ﻣﺸﺎﻫﺪه ﭘﺬﯾﺮ ﺟﺰﺋﯽ‪ ،‬اﺗﻔﺎﻗﯽ‪ ،‬ﺗﺮﺗﯿﺒﯽ‪ ،‬ﭘﻮﯾﺎ‪ ،‬ﭘﯿﻮﺳﺘﻪ و ﭼﻨﺪﻋﺎﻣﻠﯽ‬
‫ﺗﻮاﺑﻊ و ﺑﺮﻧﺎﻣﻪ ﻫﺎي ﻋﺎﻣﻞ‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬

‫‪23‬‬ ‫‪24‬‬
‫ﯾﮏ ﻋﺎﻣﻞ ﮐﺎﻣﻼ ﺑﻮﺳﯿﻠﻪ ﺗﺎﺑﻊ ﻋﺎﻣﻞ ﻣﺸﺨﺺ ﻣﯽ ﺷﻮد‪.‬‬ ‫‪‬‬ ‫ﯾﮏ روش ﺑﻪ ﻣﻨﻈﻮر ﺗﻮﺻﯿﻒ ﺗﺎﺑﻊ ﻋﺎﻣﻞ‬ ‫‪‬‬
‫‪ ‬ﯾﺎدآوري‪ :‬ﺗﺎﺑﻊ ﻋﺎﻣﻞ دﻧﺒﺎﻟﻪ ادراﮐﯽ را ﺑﻪ ﻋﻤﻞ ﻧﮕﺎﺷﺖ ﻣﯽ ﮐﻨﺪ‪.‬‬ ‫ﻧﺸﺎن دﻫﻨﺪه ﻓﻌﺎﻟﯿﺖ ﻣﻨﺎﺳﺐ ﺑﺮاي ﻫﺮ دﻧﺒﺎﻟﻪ ادراﮐﯽ ﻣﻤﮑﻦ‬ ‫‪‬‬
‫‪Percept Sequence‬‬ ‫‪Action‬‬ ‫ﻣﺜﺎل‪ :‬ﺟﺪول دﻧﯿﺎي ﺟﺎروﺑﺮﻗﯽ‬ ‫‪‬‬
‫ﯾﮏ ﺗﺎﺑﻊ ﻋﺎﻣﻞ )ﯾﺎ ﯾﮏ ﮐﻼس ﻫﻢ ارزي ﮐﻮﭼﮏ( ﻋﻘﻼﻧﯽ )‪(rational‬ﻣﯽ‬ ‫‪‬‬ ‫]‪[A, Clean‬‬ ‫‪Right‬‬
‫ﺑﺎﺷﺪ‪.‬‬ ‫]‪[A, Dirty‬‬ ‫‪Suck‬‬
‫]‪[B, Clean‬‬ ‫‪Left‬‬
‫]‪[B, Dirty‬‬ ‫‪Suck‬‬
‫ﻫﺪف‪ :‬ﯾﺎﻓﺘﻦ روﺷﯽ ﺑﻪ ﻣﻨﻈﻮر ﭘﯿﺎده ﺳﺎزي ﺗﺎﺑﻊ ﻋﺎﻣﻞ ﻋﻘﻼﻧﯽ ﺑﻪ ﻃﻮر‬ ‫‪‬‬
‫]‪[A, Clean], [A, Clean‬‬ ‫‪Right‬‬
‫ﻣﺨﺘﺼﺮ و ﻣﻔﯿﺪ‬ ‫]‪[A, Clean], [A, Dirty‬‬ ‫‪Suck‬‬
‫…‬
‫‪۶‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬

‫‪25‬‬ ‫‪26‬‬
‫‪function TABLE-DRIVEN-AGENT( percept) returns an action‬‬

‫‪static: percepts, a sequence, initially empty‬‬ ‫ﻣﻌﺎﯾﺐ‪:‬‬ ‫‪‬‬
‫‪table, a table of actions, indexed by percept sequence,‬‬ ‫ﺳﻄﺮ(‬ ‫‪10150‬‬

‫‪ ‬ﺟﺪول ﺑﺴﯿﺎر ﻋﻈﯿﻢ )ﻣﺜﻼ در ﺷﻄﺮﻧﺞ‬
‫‪initially fully specified‬‬ ‫‪ ‬زﻣﺎن ﺑﺴﯿﺎر زﯾﺎد ﺑﺮاي اﯾﺠﺎد ﺟﺪول و اﺣﺘﻤﺎل ﺑﺎﻻي ﺧﻄﺎ‬
‫‪ ‬ﻋﺪم ﺧﻮد ﻣﺨﺘﺎري‬
‫‪append percept to the end of percepts‬‬ ‫‪ ‬ﺣﺘﯽ ﺑﺎ ﻗﺎﺑﻠﯿﺖ ﯾﺎدﮔﯿﺮي‪ ،‬ﻧﯿﺎز ﺑﻪ زﻣﺎن ﺑﺴﯿﺎر زﯾﺎدي ﺑﺮاي ﯾﺎدﮔﯿﺮي ﻣﺪاﺧﻞ‬
‫)‪action  LOOKUP( percepts, table‬‬ ‫ﺟﺪول دارد‪.‬‬
‫‪return action‬‬
‫اﻧﻮاع ﻋﺎﻣﻞ ﻫﺎ‬ ‫ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده‬

‫‪27‬‬ ‫‪28‬‬ ‫ﺳﺎده ﺗﺮﯾﻦ ﻧﻮع ﻋﺎﻣﻞ‬ ‫‪‬‬
‫در ﻫﺮ ﻟﺤﻈﻪ‪ ،‬ﻋﻤﻞ ﺗﻨﻬﺎ ﺑﺮ اﺳﺎس درك ﻓﻌﻠﯽ اﻧﺘﺨﺎب ﻣﯽ ﺷﻮد‬ ‫‪‬‬
‫ﭼﻬﺎر ﻧﻮع اﺻﻠﯽ ﺑﻪ ﺗﺮﺗﯿﺐ اﻓﺰاﯾﺶ ﻋﻤﻮﻣﯿﺖ )‪:(Generality‬‬ ‫‪‬‬ ‫ﻣﺜﺎل‪:‬‬ ‫‪‬‬
‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده )‪(Simple reflex‬‬

‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل )‪(Model-based reflex‬‬ ‫‪function REFLEX-VACCUM-AGENT( [location, status]) returns an action‬‬
‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف )‪(Goal-based‬‬ ‫‪if status = Dirty then return Suck‬‬
‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي )‪(Utility-based‬‬ ‫‪else if location = A then return Right‬‬
‫‪else if location = B then return Left‬‬
‫ﺷﺎﻣﻞ ﻗﻮاﻧﯿﻦ ﺷﺮط‪-‬ﻋﻤﻞ ﻣﺎﻧﻨﺪ‪:‬‬ ‫‪‬‬

‫‪” ‬اﮔﺮ ﭼﺮاغ ﺗﺮﻣﺰ اﺗﻮﻣﻮﺑﯿﻞ ﺟﻠﻮﯾﯽ روﺷﻦ ﺷﺪ‪ ،‬آﻧﮕﺎه ﺗﺮﻣﺰ ﮐﻦ“‬
‫‪٧‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﺳﺎﺧﺘﺎر ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده‬ ‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﺳﺎده‬

‫‪29‬‬ ‫‪30‬‬
‫‪Agent‬‬ ‫‪Sensors‬‬ ‫‪function SIMPLE-REFLEX-AGENT( percept) returns an action‬‬

‫‪static: rules, a set of condition-action rules‬‬
‫‪What the world‬‬
‫‪is like now‬‬
‫‪Environment‬‬
‫)‪state  INTERPRET-INPUT( percept‬‬
‫)‪rule  RULE-MATCH( state, rules‬‬
‫]‪action  RULE-ACTION[ rule‬‬
‫‪What action I‬‬
‫‪Condition-action rules‬‬ ‫‪return action‬‬
‫‪should do now‬‬
‫‪Actuators‬‬
‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬ ‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل)اداﻣﻪ‪(...‬‬

‫‪31‬‬ ‫‪32‬‬
‫ﻋﺎﻣﻞﻫﺎﯾﯽ ﮐﻪ اﺛﺮات دﻧﯿﺎ را ﺣﻔﻆ ﻣﯽﮐﻨﻨﺪ‬

‫ﺑﻬﻨﮕﺎمﺳﺎزي اﻃﻼﻋﺎت وﺿﻌﯿﺖ داﺧﻠﯽ ﻫﻤﺰﻣﺎن ﺑﺎ ﮔﺬر زﻣﺎن ﻧﯿﺎزﻣﻨﺪ دو ﻧﻮع داﻧﺶ ﮐﺪ‬
‫ﺷﺪه در ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ اﺳﺖ‪.‬‬
‫از آﻧﺠﺎﯾﯽ ﻧﺎﺷﯽ ﻣﯽﺷﻮد ﮐﻪ ﺣﺴﮕﺮﻫﺎ ﻧﻤﯽﺗﻮاﻧﻨﺪ دﺳﺘﺮﺳﯽ ﮐﺎﻣﻞ ﺑﻪ وﺿﻌﯿﺖ دﻧﯿﺎ را ﺑﻪ‬
‫وﺟﻮد آورﻧﺪ‪.‬‬
‫اول‪ :‬ﻧﯿﺎزﻣﻨﺪ آﻧﯿﻢ ﮐﻪ ﺑﺮﺧﯽ اﻃﻼﻋﺎت درﺑﺎره ﭼﮕﻮﻧﮕﯽ ﺗﻐﯿﯿﺮ ﺟﻬﺎن ﻣﺴﺘﻘﻞ از ﻋﺎﻣﻞ را‬
‫در ﭼﻨﯿﻦ ﺷﺮاﯾﻄﯽ‪ ،‬ﻋﺎﻣﻞ ﻣﻤﮑﻦ اﺳﺖ ﻧﯿﺎزﻣﻨﺪ دﺳﺘﮑﺎري ﺑﺮﺧﯽ اﻃﻼﻋﺎت وﺿﻌﯿﺖ داﺧﻠﯽ‬
‫داﺷﺘﻪ ﺑﺎﺷﯿﻢ‪.‬‬
‫ﺑﺎﺷﺪ ﺗﺎ از ﻃﺮﯾﻖ آن ﺗﻤﺎﯾﺰ ﺑﯿﻦ وﺿﻌﯿﺖﻫﺎي دﻧﯿﺎ ﮐﻪ در ﻇﺎﻫﺮ ورودي ادراﮐﯽ ﯾﮑﺴﺎﻧﯽ‬
‫دوم‪ :‬ﻧﯿﺎزﻣﻨﺪ اﻃﻼﻋﺎت درﺑﺎره اﻋﻤﺎل ﺧﻮد ﻫﺴﺘﯿﻢ ﮐﻪ ﺑﺮ روي دﻧﯿﺎ اﺛﺮﮔﺬار اﺳﺖ‪.‬‬
‫ﻣﯽﮐﻨﻨﺪ وﻟﯽ در واﻗﻊ ﻣﻌﻨﯽ ﮐﺎﻣﻼً ﻣﺘﻔﺎوﺗﯽ دارﻧﺪ را ﻣﯿﺴﺮ ﺳﺎزد‪.‬‬
‫‪٨‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل )ﺣﺎﻓﻈﻪ دار(‬ ‫ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬
‫‪33‬‬ ‫‪34‬‬
‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﺳﺎده در ﺻﻮرﺗﯽ ﮐﺎر ﻣﯽ ﮐﻨﺪ ﮐﻪ ﻣﺤﯿﻂ ﮐﺎﻣﻼ ﻗﺎﺑﻞ‬ ‫‪‬‬
‫‪State‬‬
‫‪Sensors‬‬
‫ﻣﺸﺎﻫﺪه ﺑﺎﺷﺪ‬
‫اﮔﺮ ﻣﺤﯿﻂ ﻣﺸﺎﻫﺪه ﭘﺬﯾﺮ ﺟﺰﺋﯽ ﺑﺎﺷﺪ‪ ،‬ﭘﯿﮕﯿﺮي ﺗﻐﯿﯿﺮات دﻧﯿﺎ ﻻزم اﺳﺖ‬ ‫‪‬‬ ‫‪How the world evolves‬‬
‫ﻣﺜﺎل‪ :‬ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬ ‫‪What my actions do‬‬
‫ﻣﺴﺘﻠﺰم دو ﻧﻮع داﻧﺶ‬ ‫‪‬‬
‫‪ ‬ﻧﺤﻮه ﺗﻐﯿﯿﺮ دﻧﯿﺎ‬

‫‪ ‬ﺗﺎﺛﯿﺮ اﻋﻤﺎل ﻋﺎﻣﻞ ﺑﺮ دﻧﯿﺎ‬ ‫‪Condition-action rules‬‬
‫‪Agent‬‬ ‫‪Actuators‬‬
‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف‬

‫‪35‬‬ ‫‪36‬‬
‫‪function REFLEX-AGENT-WITH-STATE( percept) returns an action‬‬ ‫ﻋﺎﻣﻞﻫﺎي ﻫﺪف ﮔﺮا‪:‬‬

‫‪static: state, a description of the current world state‬‬
‫‪rules, a set of condition-action rules‬‬
‫‪action, the most recent action, initially none‬‬ ‫داﻧﺴﺘﻦ درﺑﺎره وﺿﻌﯿﺖ ﮐﻨﻮﻧﯽ ﻣﺤﯿﻂ ﻫﻤﻮاره ﺑﺮاي ﺗﺼﻤﯿﻢﮔﯿﺮي ﻋﻤﻞ ﻧﻤﯽﺗﻮاﻧﺪ ﮐﺎﻓﯽ‬
‫ﺑﺎﺷﺪ‪.‬‬
‫)‪state  UPDATE-STATE( state, action, percept‬‬
‫ﺑﻪ ﻫﻤﺎن ﮔﻮﻧﻪ ﮐﻪ ﻋﺎﻣﻞ ﻧﯿﺎزﻣﻨﺪ ﺷﺮح وﺿﻌﯿﺖ ﺟﺎري اﺳﺖ‪ ،‬ﺑﻪ ﻧﻮﻋﯽ ﻧﯿﺎزﻣﻨﺪ اﻃﻼﻋﺎت‬
‫)‪rule  RULE-MATCH( state, rules‬‬
‫ﻫﺪف)‪ (goal‬ﻣﯽﺑﺎﺷﺪ ﮐﻪ ﺗﻮﺿﯿﺢ ﻣﻮﻗﻌﯿﺖ ﻣﻄﻠﻮب اﺳﺖ‪.‬‬
‫]‪action  RULE-ACTION[ rule‬‬
‫‪return action‬‬
‫‪٩‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬

‫‪37‬‬ ‫‪38‬‬
‫ﺗﻔﺎوت ﻋﺎﻣﻞﻫﺎي واﮐﻨﺸﯽ و ﻫﺪفﮔﺮا‪:‬‬

‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻣﯽﺗﻮاﻧﺪ اﯾﻦ اﻃﻼﻋﺎت را ﺑﺎ اﻃﻼﻋﺎﺗﯽ درﺑﺎره ﻧﺘﺎﯾﺞ اﻋﻤﺎل ﻣﻤﮑﻦ )ﻫﻤﺎﻧﻨﺪ‬
‫در ﻃﺮاﺣﯽ ﻋﺎﻣﻞﻫﺎي واﮐﻨﺸﯽ ﻃﺮاح ﺑﺮاي ﺣﺎﻻت ﻣﺘﻔﺎوت ﻋﻤﻠﯽ درﺳﺖ را ﭘﯿﺶ ﻣﺤﺎﺳﺒﻪ‬
‫اﻃﻼﻋﺎﺗﯽ ﮐﻪ در ﻋﺎﻣﻞ واﮐﻨﺶ ﺑﺮاي ﺑﻬﻨﮕﺎمﺳﺎزي وﺿﻌﯿﺖ داﺧﻠﯽ اﺳﺘﻔﺎده ﺷﺪ( ﺗﺮﮐﯿﺐ‬
‫ﻣﯽﮐﻨﺪ‪ .‬در ﻋﺎﻣﻞﻫﺎي‬
‫ﻧﻤﻮده ﺗﺎ اﻋﻤﺎل ﻣﻨﺎﺳﺐ را ﺑﺮاي دﺳﺘﺮﺳﯽ ﺑﻪ ﻫﺪف اﻧﺘﺨﺎب ﻧﻤﺎﯾﺪ‪.‬‬
‫ﻫﺪفﮔﺮا‪ ،‬ﻋﺎﻣﻞ ﻣﯽﺗﻮاﻧﺪ داﻧﺶ ﺧﻮد را در ﻣﻮرد ﭼﮕﻮﻧﮕﯽ واﮐﻨﺶ ﺑﻬﻨﮕﺎم ﺳﺎزد‪.‬‬
‫در ﻣﻮاﻗﻌﯽ ﺳﺎده اﺳﺖ‪ :‬ﮐﻪ رﺿﺎﯾﺖ از ﻫﺪف ﺑﻼﻓﺎﺻﻠﻪ از ﻋﻤﻞ واﺣﺪ ﺗﻮﻟﯿﺪ ﮔﺮدد‪.‬‬
‫‪ .١‬ﺑﺮاي ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺎ ﻣﺠﺒﻮر ﺑﻪ دوﺑﺎره ﻧﻮﯾﺴﯽ ﺗﻌﺪاد زﯾﺎدي ﻗﻮاﻧﯿﻦ ﺷﺮط –ﻋﻤﻞ‬
‫در ﻣﻮاﻗﻌﯽ ﭘﯿﭽﯿﺪه اﺳﺖ‪ :‬ﮐﻪ ﻋﺎﻣﻞ ﺑﺎﯾﺪ دﻧﺒﺎﻟﻪﻫﺎي ﻃﻮﻻﻧﯽ را در ﻧﻈﺮﮔﺮﻓﺘﻪ ﺗﺎ راﻫﯽ‬
‫ﺧﻮاﻫﯿﻢ ﺑﻮد‪.‬‬
‫ﺑﺮاي دﺳﺘﯿﺎﺑﯽ ﺑﻪ ﻫﺪف ﭘﯿﺪا ﮐﻨﺪ‪.‬‬
‫‪ .٢‬ﻋﺎﻣﻞ ﻫﺪفﮔﺮا ﻧﺴﺒﺖ ﺑﻪ رﺳﯿﺪن ﺑﻪ ﻣﻘﺎﺻﺪ ﻣﺘﻔﺎوت اﻧﻌﻄﺎف ﭘﺬﯾﺮ اﺳﺖ‪.‬‬
‫‪ .٣‬ﺑﺴﺎدﮔﯽ ﺑﺎ ﺗﻌﯿﯿﻦ ﯾﮏ ﻫﺪف ﺗﺎزه‪ ،‬ﻣﯽﺗﻮاﻧﯿﻢ ﻋﺎﻣﻞ ﻫﺪفﮔﺮا را ﺑﻪ رﻓﺘﺎر ﺗﺎزه ﺑﺮﺳﺎﻧﯿﻢ‪.‬‬
‫در ﻣﻮاﻗﻊ ﭘﯿﭽﯿﺪه‪ ،‬ﺟﺴﺘﺠﻮ و ﺑﺮﻧﺎﻣﻪرﯾﺰي ﺑﻪ ﯾﺎﻓﺘﻦ دﻧﺒﺎﻟﻪ اﻋﻤﺎل ﻣﻨﺠﺮ ﺧﻮاﻫﻨﺪ ﺷﺪ‪.‬‬
‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف‬

‫‪39‬‬ ‫‪40‬‬
‫‪Sensors‬‬
‫‪State‬‬
‫اﻃﻼﻋﺎت ﻻزم ﺑﺮاي ﺗﺼﻤﯿﻢ ﮔﯿﺮي در ﻣﻮرد ﻋﻤﻠﯽ ﮐﻪ ﺑﺎﯾﺪ اﻧﺠﺎم ﺷﻮد‪:‬‬ ‫‪‬‬
‫‪ ‬اﻃﻼﻋﺎت ﻣﺮﺑﻮط ﺑﻪ ﺣﺎﻟﺖ ﻓﻌﻠﯽ‬ ‫‪How the world evolves‬‬
‫‪ ‬اﻃﻼﻋﺎت ﻫﺪف )ﺗﻮﺻﯿﻒ ﻣﻮﻗﻌﯿﺖ ﻣﻄﻠﻮب(‬
‫‪What my actions do‬‬
‫‪ ‬ﻣﺜﺎل‪ :‬ﻋﻤﻞ ﻣﻨﺎﺳﺐ ﺑﺮاي ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ در ﯾﮏ ﭼﻬﺎر راه ﮐﺪام اﺳﺖ؟‬ ‫‪What it will be like‬‬
‫)ﺑﺎﻻ‪ ،‬ﭘﺎﯾﯿﻦ ﭼﭗ‪ ،‬راﺳﺖ(‬ ‫‪if I do action A‬‬
‫اﮔﺮ ﺑﺮاي رﺳﯿﺪن ﺑﻪ ﻫﺪف ﻧﯿﺎز ﺑﻪ ﭼﻨﺪﯾﻦ ﻋﻤﻞ ﺑﺎﺷﺪ‬ ‫‪‬‬

‫‪ ‬ﺟﺴﺘﺠﻮ )‪(search‬‬ ‫‪Goals‬‬
‫‪ ‬ﺑﺮﻧﺎﻣﻪ رﯾﺰي )‪(planning‬‬
‫‪١٠‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي)اداﻣﻪ‪(...‬‬

‫‪41‬‬ ‫‪42‬‬
‫ﻋﺎﻣﻞﻫﺎي ﺳﻮدﻣﻨﺪ‪:‬‬ ‫ﺳﻮدﻣﻨﺪي‪ :‬ﺗﺎﺑﻌﯽ اﺳﺖ ﮐﻪ ﯾﮏ وﺿﻌﯿﺖ را ﺑﻪ ﻋﺪد ﺣﻘﯿﻘﯽ ﻧﮕﺎﺷﺖ ﻣﯽدﻫﺪ‪ ،‬ﮐﻪ درﺟﻪ‬
‫رﺿﺎﯾﺖ ﻣﺮﺑﻮط را ﺗﺸﺮﯾﺢ ﻣﯽﮐﻨﺪ‪.‬‬
‫‪ ‬اﻫﺪاف ﺑﻪ ﺗﻨﻬﺎﯾﯽ ﺑﺮاي ﺗﻮﻟﯿﺪ رﻓﺘﺎر ﺑﺎ ﮐﯿﻔﯿﺖ ﺑﺎﻻ ﮐﺎﻓﯽ ﻧﯿﺴﺘﻨﺪ‪.‬‬ ‫ﻣﺸﺨﺼﺎت ﮐﺎﻣﻞ ﺗﺎﺑﻊ ﺳﻮدﻣﻨﺪي اﻣﮑﺎن ﺗﺼﻤﯿﻢﮔﯿﺮي ﻣﻨﻄﻘﯽ را ﺑﺮاي دو ﻧﻮع ﺣﺎﻟﺘﯽ ﮐﻪ‬
‫ﻫﺪف ﻣﺸﮑﻞ دارد‪ ،‬اﺟﺎزه ﻣﯽدﻫﺪ‪.‬‬
‫‪ ‬ﻣﻼك ﮐﺎراﯾﯽ ﻋﻮﻣﯽ ﺑﺎﯾﺪ ﻣﻘﺎﯾﺴﻪاي ﺑﯿﻦ وﺿﻌﯿﺖﻫﺎي دﻧﯿﺎي ﻣﺘﻔﺎوت )ﯾﺎ دﻧﺒﺎﻟﻪ ﺣﺎﻻت(‬
‫را ﺑﺮ ﭘﺎﯾﻪ ﭼﮕﻮﻧﮕﯽ رﺿﺎﯾﺖ ﻋﺎﻣﻞ در ﺻﻮرت ﺣﺼﻮل ﻫﺪف ﺑﺪﻫﺪ‪.‬‬ ‫‪ .١‬زﻣﺎﻧﯽ ﮐﻪ اﻫﺪاف ﻣﺘﻨﺎﻗﺺ وﺟﻮد دارﻧﺪ‪.‬‬
‫‪ ‬ﺑﻨﺎﺑﺮاﯾﻦ اﮔﺮ ﯾﮏ وﺿﻌﯿﺖ دﻧﯿﺎ ﺑﻪ دﯾﮕﺮي ﺗﺮﺟﯿﺢ داده ﻣﯽﺷﻮد‪ ،‬آﻧﮕﺎه آن ﺑﺮاي ﻋﺎﻣﻞ‬ ‫‪ .٢‬زﻣﺎﻧﯽ ﮐﻪ ﭼﻨﺪﯾﻦ ﻫﺪف دارﻧﺪ ﮐﻪ ﻋﺎﻣﻞ ﻣﯽﺗﻮاﻧﺪ آﻧﻬﺎ را ﻫﺪف ﻗﺮار دﻫﺪ و ﻫﯿﭽﮑﺪام از‬
‫ﺳﻮدﻣﻨﺪﺗﺮ ﺧﻮاﻫﺪ ﺑﻮد‬ ‫آﻧﻬﺎ ﺑﺎ ﻗﻄﻌﯿﺖ ﻗﺎﺑﻞ ﺣﺼﻮل ﻧﯿﺴﺖ‪.‬‬
‫ﻋﺎﻣﻞ ﻫﺎي ﺳﻮدﻣﻨﺪ‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي‬

‫‪43‬‬ ‫‪44‬‬
‫‪Sensors‬‬
‫در ﺑﺴﯿﺎري از ﻣﺤﯿﻂ ﻫﺎ اﻫﺪاف ﺑﺮاي ﺗﻮﻟﯿﺪ رﻓﺘﺎري ﺑﺎ ﮐﯿﻔﯿﺖ ﺑﺎﻻ ﻣﻨﺎﺳﺐ‬ ‫‪‬‬
‫‪State‬‬
‫ﻧﯿﺴﺘﻨﺪ‬ ‫‪What the world‬‬

‫‪How the world evolves‬‬
‫ﻣﺜﺎل‪ :‬ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬ ‫‪is like now‬‬
‫‪ ‬ﻣﻤﮑﻦ اﺳﺖ ﭼﻨﺪﯾﻦ ﻣﺴﯿﺮ ﺑﺮاي رﺳﯿﺪن ﺑﻪ ﻣﻘﺼﺪ ﻣﻮﺟﻮد ﺑﺎﺷﺪ‪ ،‬اﻣﺎ ﺑﻌﻀﯽ از آﻧﻬﺎ‬
‫‪What it will be like if‬‬
‫ﺳﺮﯾﻌﺘﺮ‪ ،‬اﻣﻦ ﺗﺮ‪ ،‬ﻣﻄﻤﺌﻦ ﺗﺮ و ﯾﺎ ارزاﻧﺘﺮ از ﺑﻘﯿﻪ ﻣﯽ ﺑﺎﺷﻨﺪ‬ ‫‪What my actions do‬‬
‫‪I do action A‬‬
‫اﻫﺪاف ﻣﻼﮐﯽ ﺧﺎم ﺑﺮاي ﺗﻮﺻﯿﻒ وﺿﻌﯿﺖ ﻫﺎ ﻫﺴﺘﻨﺪ )ﻣﻄﻠﻮب و ﻧﺎﻣﻄﻠﻮب(‬ ‫‪‬‬
‫ﺗﺎﺑﻊ ﺳﻮدﻣﻨﺪي‪ :‬ﺣﺎﻟﺖ ) ﯾﺎ دﻧﺒﺎﻟﻪ اي از ﺣﺎﻻت( را ﺑﻪ ﯾﮏ ﻋﺪد ﺣﻘﯿﻘﯽ‬ ‫‪‬‬ ‫‪Utility‬‬

‫‪How happy I will be‬‬
‫ﻧﮕﺎﺷﺖ ﻣﯽ ﮐﻨﺪ ﮐﻪ درﺟﻪ ﻣﻄﻠﻮﺑﯿﺖ آن را ﺗﻮﺻﯿﻒ ﻣﯽ ﮐﻨﺪ‬ ‫‪in such a state‬‬
‫اﻣﮑﺎن ﺗﺼﻤﯿﻢ ﮔﯿﺮي در ﻣﻮاردي ﮐﻪ‪:‬‬ ‫‪‬‬ ‫‪What action I‬‬

‫‪ ‬اﻫﺪاف ﻣﺘﻨﺎﻗﺾ ﺑﺎﺷﻨﺪ‬ ‫‪should do now‬‬
‫‪ ‬ﭼﻨﺪﯾﻦ ﻫﺪف وﺟﻮد دارد وﻟﯽ رﺳﯿﺪن ﺑﻪ ﻫﯿﭻ ﯾﮏ ﻗﻄﻌﯽ ﻧﯿﺴﺖ‬ ‫‪Agent‬‬
‫‪Actuators‬‬
‫‪١١‬‬
‫‪٠٩/٢٩/١۴٣۶‬‬
‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه‬

‫‪45‬‬ ‫‪46‬‬
‫ﺗﻮرﯾﻨﮓ )‪ :(1950‬اﯾﺪه ﺑﺮﻧﺎﻣﻪ ﻧﻮﯾﺴﯽ واﻗﻌﯽ ﻫﻮﺷﻤﻨﺪ ﺑﻪ ﺻﻮرت دﺳﺘﯽ‬ ‫‪‬‬ ‫اﻧﻮاع داﻧﺸﯽ ﮐﻪ ﻋﻨﺼﺮ ﯾﺎدﮔﯿﺮﻧﺪه ﻣﯽ ﺗﻮاﻧﺪ ﯾﺎد ﺑﮕﯿﺮد‪:‬‬ ‫‪‬‬
‫‪ ‬ﻧﯿﺎز ﺑﻪ روش ﻫﺎي ﺳﺮﯾﻌﺘﺮ‬
‫‪ ‬ﯾﺎدﮔﯿﺮي ﻣﺴﺘﻘﯿﻢ از دﻧﺒﺎﻟﻪ ادراﮐﯽ‬
‫‪ ‬ﺳﺎﺧﺖ ﻣﺎﺷﯿﻦ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه و آﻣﻮزش ﺑﻪ آﻧﻬﺎ‬
‫ﻣﻮﻟﻔﻪ ﻫﺎي ﻋﺎﻣﻞ ﯾﺎدﮔﯿﺮﻧﺪه‬ ‫‪‬‬ ‫‪ ‬ﯾﺎدﮔﯿﺮي ﻧﺤﻮه ﺗﻐﯿﯿﺮات دﻧﯿﺎ‪ :‬ﻣﺸﺎﻫﺪه دو ﺣﺎﻟﺖ ﻣﺘﻮاﻟﯽ‬
‫ﻋﻨﺼﺮ ﯾﺎدﮔﯿﺮﻧﺪه ‪ :‬ﺑﺮاي اﯾﺠﺎد ﺑﻬﺒﻮد‬ ‫‪‬‬ ‫‪ ‬ﯾﺎدﮔﯿﺮي در ﻣﻮرد ﺗﺎﺛﯿﺮ ﻋﻤﻞ ﻋﺎﻣﻞ‪ :‬ﻣﺸﺎﻫﺪه ﻧﺘﺎﯾﺞ ﻓﻌﺎﻟﯿﺖ ﻋﺎﻣﻞ‬
‫ﻋﻨﺼﺮ ﮐﺎرآﯾﯽ‪ :‬اﻧﺘﺨﺎب ﻓﻌﺎﻟﯿﺖ ﻫﺎي ﺧﺎرﺟﯽ‬ ‫‪‬‬
‫‪ ‬ﻣﺜﺎل‪ :‬ﻧﺤﻮه ﺗﺮﻣﺰ ﮐﺮدن در ﺟﺎده ﻫﺎي ﺧﯿﺲ‬
‫ﻣﻨﺘﻘﺪ‪ :‬ﺗﻮﻟﯿﺪ ﺑﺎزﺧﻮرد ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ اﺳﺘﺎﻧﺪارد ﮐﺎرآﯾﯽ ﺑﺮاي ﻋﻨﺼﺮ ﯾﺎدﮔﯿﺮﻧﺪه‬ ‫‪‬‬
‫ﻣﻮﻟﺪ ﻣﺴﺎﻟﻪ‪ :‬ﭘﯿﺸﻨﻬﺎد ﻓﻌﺎﻟﯿﺖ ﻫﺎي اﮐﺘﺸﺎﻓﯽ‬ ‫‪‬‬
‫ﻣﺜﺎل‪ :‬ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬ ‫ﭘﺎداش و ﺟﺮﯾﻤﻪ‬ ‫‪‬‬

‫ﻋﻨﺼﺮ ﮐﺎرآﯾﯽ‪ :‬ﺣﺮﮐﺖ ﺳﺮﯾﻊ از ﺧﻂ ‪ 3‬ﺑﻪ ﺧﻂ ‪1‬‬ ‫‪‬‬
‫ﻣﻨﺘﻘﺪ‪ :‬درﯾﺎﻓﺖ ﺷﮑﺎﯾﺖ راﻧﻨﺪه ﻫﺎي دﯾﮕﺮ‬ ‫‪‬‬
‫اﯾﺠﺎد ﻗﺎﻧﻮﻧﯽ ﺑﯿﺎﻧﮕﺮ ﺑﺪ ﺑﻮدن اﯾﻦ ﻋﻤﻞ و اﺻﻼح ﻋﻨﺼﺮ ﮐﺎرآﯾﯽ‬ ‫‪‬‬
‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮي‬

‫‪Performance standard‬‬
‫‪47‬‬
‫‪Critic‬‬ ‫‪Sensors‬‬
‫‪feedback‬‬
‫‪changes‬‬
‫‪Learning‬‬ ‫‪Performance‬‬
‫‪element‬‬ ‫‪element‬‬
‫‪knowledge‬‬
‫‪learning‬‬
‫‪goals‬‬
‫‪Problem‬‬
‫‪generator‬‬
‫‪١٢‬‬

AI-Chapter 2

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

AI-Chapter 2

Uploaded by

Copyright:

Available Formats

‫‪٠٩/٢٩/١۴٣۶‬‬

‫‪http://mbzir.com‬‬ ‫‪, http://csiz.ir‬‬

‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻋﺎﻣﻞ ﻫﺎ‬

‫ﻋﻘﻼﻧﯽ ﺑﻮدن‬ ‫‪‬‬ ‫ﮐﻨﺪ و در آن ﻣﺤﯿﻂ از ﻃﺮﯾﻖ اﺛﺮﮐﻨﻨﺪه ﻫﺎ ﻋﻤﻞ ﮐﻨﺪ‪.‬‬

‫اﻧﻮاع ﻣﺤﯿﻂ ﻫﺎ‬ ‫‪‬‬

‫‪ ‬دورﺑﯿﻦ ﻫﺎ و ﻓﺎﺻﻠﻪ ﯾﺎب ﻣﺎدون ﻗﺮﻣﺰ ﺑﻪ ﻋﻨﻮان ﺣﺴﮕﺮﻫﺎ‬

‫ﻋﺎﻣﻞ ﻫﺎ و ﻣﺤﯿﻂ ﻫﺎ‬ ‫دﻧﯿﺎي ﺟﺎرو ﺑﺮﻗﯽ‬

‫ﺗﺎﺑﻊ ﻋﺎﻣﻞ ﺗﺎرﯾﺨﭽﻪ ادراﮐﯽ را ﺑﻪ اﻋﻤﺎل ﻧﮕﺎﺷﺖ ﻣﯽ ﮐﻨﺪ‪:‬‬ ‫‪‬‬

‫ﻋﺎﻣﻞ = ﻣﻌﻤﺎري ‪ +‬ﺑﺮﻧﺎﻣﻪ‬ ‫‪‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ اﯾﺪه آل‬

‫ﻋﺎﻣﻞ ﻫﺎي ﻋﻘﻼﻧﯽ‬ ‫‪PEAS‬‬

‫‪PEAS: Performance measure, Environment, Actuators, Sensors‬‬ ‫‪‬‬

‫ﻫﺮ ﻣﺤﯿﻂ داراي ﻣﺠﻤﻮﻋﻪ اي از ﺣﺎﻟﺖ ﻫﺎ ﻣﯽ ﺑﺎﺷﺪ‪:‬‬ ‫‪‬‬

‫‪ ‬اﺛﺮﮐﻨﻨﺪه ﻫﺎ‪ :‬ﺻﻔﺤﻪ ﻧﻤﺎﯾﺶ )ﺗﻤﺮﯾﻦ ﻫﺎ‪ ،‬ﭘﯿﺸﻨﻬﺎدات و اﺻﻼﺣﺎت(‬

‫ﻋﺎﻣﻞ و ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬

‫‪ ‬ﺗﺸﺨﯿﺺ ﻣﮑﺎن ‪ :‬ﭼﭗ ﯾﺎ راﺳﺖ‬

‫‪SUCK‬‬ ‫] ]‪[ LEFT, [CLEAN, DIRTY‬‬

‫اﻧﻮاع ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬

‫ﻣﺜﺎل‪ :‬روﺑﺎت ﮐﻨﺘﺮل ﮐﻨﻨﺪه ﮐﯿﻔﯿﺖ‬ ‫‪‬‬

‫‪Accept‬‬ ‫‪Reject‬‬ ‫‪Accept‬‬

‫اﻧﻮاع ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬

‫اﻧﻮاع ﻣﺤﯿﻂ‬ ‫اﻧﻮاع ﻣﺤﯿﻂ‬

‫ﻋﻤﻞ ﻣﯽ ﮐﻨﺪ‪.‬‬ ‫ﺧﯿﺮ‬ ‫ﺑﻠﻪ‬ ‫ﺑﻠﻪ‬ ‫ﮐﺎﻣﻼ ﻗﺎﺑﻞ ﻣﺸﺎﻫﺪه‬

‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫ﺧﯿﺮ‬ ‫دوره اي‬

‫• ﻧﻮع ﻣﺤﯿﻂ ﺑﻪ ﻣﯿﺰان زﯾﺎدي ﺗﻌﯿﯿﻦ ﮐﻨﻨﺪه ﻃﺮاﺣﯽ ﻋﺎﻣﻞ ﻣﯽ ﺑﺎﺷﺪ‪.‬‬

‫ﺗﻮاﺑﻊ و ﺑﺮﻧﺎﻣﻪ ﻫﺎي ﻋﺎﻣﻞ‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬

‫‪Percept Sequence‬‬ ‫‪Action‬‬ ‫ﻣﺜﺎل‪ :‬ﺟﺪول دﻧﯿﺎي ﺟﺎروﺑﺮﻗﯽ‬ ‫‪‬‬

‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺟﺪول ﺟﺴﺘﺠﻮ‬

‫‪function TABLE-DRIVEN-AGENT( percept) returns an action‬‬

‫‪table, a table of actions, indexed by percept sequence,‬‬ ‫ﺳﻄﺮ(‬ ‫‪10150‬‬

‫اﻧﻮاع ﻋﺎﻣﻞ ﻫﺎ‬ ‫ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده‬

‫‪ ‬ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده )‪(Simple reflex‬‬

‫ﺷﺎﻣﻞ ﻗﻮاﻧﯿﻦ ﺷﺮط‪-‬ﻋﻤﻞ ﻣﺎﻧﻨﺪ‪:‬‬ ‫‪‬‬

‫ﺳﺎﺧﺘﺎر ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﺳﺎده‬ ‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﺳﺎده‬

‫‪Agent‬‬ ‫‪Sensors‬‬ ‫‪function SIMPLE-REFLEX-AGENT( percept) returns an action‬‬

‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬ ‫ﻋﺎﻣﻞ واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل)اداﻣﻪ‪(...‬‬

‫ﻋﺎﻣﻞﻫﺎﯾﯽ ﮐﻪ اﺛﺮات دﻧﯿﺎ را ﺣﻔﻆ ﻣﯽﮐﻨﻨﺪ‬

‫‪ ‬ﻧﺤﻮه ﺗﻐﯿﯿﺮ دﻧﯿﺎ‬

‫ﺑﺮﻧﺎﻣﻪ ﻋﺎﻣﻞ ﻫﺎي واﮐﻨﺸﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪل‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف‬

‫‪function REFLEX-AGENT-WITH-STATE( percept) returns an action‬‬ ‫ﻋﺎﻣﻞﻫﺎي ﻫﺪف ﮔﺮا‪:‬‬

‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬

‫ﺗﻔﺎوت ﻋﺎﻣﻞﻫﺎي واﮐﻨﺸﯽ و ﻫﺪفﮔﺮا‪:‬‬

‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف)اداﻣﻪ‪(...‬‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﻫﺪف‬

‫اﮔﺮ ﺑﺮاي رﺳﯿﺪن ﺑﻪ ﻫﺪف ﻧﯿﺎز ﺑﻪ ﭼﻨﺪﯾﻦ ﻋﻤﻞ ﺑﺎﺷﺪ‬ ‫‪‬‬

‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي‬ ‫ﻋﺎﻣﻞ ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي)اداﻣﻪ‪(...‬‬

‫ﺳﻮدﻣﻨﺪﺗﺮ ﺧﻮاﻫﺪ ﺑﻮد‬ ‫آﻧﻬﺎ ﺑﺎ ﻗﻄﻌﯿﺖ ﻗﺎﺑﻞ ﺣﺼﻮل ﻧﯿﺴﺖ‪.‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﺳﻮدﻣﻨﺪ‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻮدﻣﻨﺪي‬

‫ﻧﯿﺴﺘﻨﺪ‬ ‫‪What the world‬‬

‫ﺗﺎﺑﻊ ﺳﻮدﻣﻨﺪي‪ :‬ﺣﺎﻟﺖ ) ﯾﺎ دﻧﺒﺎﻟﻪ اي از ﺣﺎﻻت( را ﺑﻪ ﯾﮏ ﻋﺪد ﺣﻘﯿﻘﯽ‬ ‫‪‬‬ ‫‪Utility‬‬

‫اﻣﮑﺎن ﺗﺼﻤﯿﻢ ﮔﯿﺮي در ﻣﻮاردي ﮐﻪ‪:‬‬ ‫‪‬‬ ‫‪What action I‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه‬ ‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮﻧﺪه‬

‫ﻣﺜﺎل‪ :‬ﺗﺎﮐﺴﯽ اﺗﻮﻣﺎﺗﯿﮏ‬ ‫‪‬‬ ‫ﭘﺎداش و ﺟﺮﯾﻤﻪ‬ ‫‪‬‬

‫ﻋﺎﻣﻞ ﻫﺎي ﯾﺎدﮔﯿﺮي‬

You might also like