AI4K12 Big Idea 3 Progression Chart Working Draft of Big Idea 3 v.11.19.2020

Machine Translated by Google
Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org
Ý tưởng lớn #3: Học tập

Những hiểu biết chính Giải trình
Học máy cho phép máy tính có được các hành vi mà không cần con người lập trình rõ ràng các hành vi Định nghĩa về "học máy"
đó.
Việc học các hành vi mới là kết quả của những thay đổi mà thuật toán học tạo ra đối với các biểu diễn Cách các thuật toán học máy hoạt động
bên trong của một mô hình lý luận, chẳng hạn như cây quyết định hoặc mạng thần kinh.
Một lượng lớn dữ liệu đào tạo được yêu cầu để thu hẹp các lựa chọn của thuật toán học tập khi mô hình Vai trò của dữ liệu huấn luyện
lý luận có khả năng thực hiện nhiều hành vi khác nhau.
Mô hình suy luận được xây dựng bởi thuật toán máy học có thể được áp dụng cho dữ liệu mới để giải quyết Giai đoạn học tập so với giai đoạn ứng dụng
vấn đề hoặc đưa ra quyết định.
V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 Có thể thay đổi dựa trên phản hồi của công chúng 1
Ý tưởng lớn #3:

LO = Mục tiêu học tập: Học sinh EU = Hiểu biết lâu dài: Mô tả giải nén được bao gồm khi cần thiết để minh họa LO hoặc EU
Học hỏi Máy tính có thể học hỏi từ dữ liệu. có thể làm gì. Những điều học sinh nên biết.
Ý tưởng K-2 3-5 6-8 9-12
Bản chất của việc học LO: Mô tả và cung cấp các ví dụ về cách mọi người học và cách máy tính LO: Phân biệt giữa cách con người học và cách máy tính học. LO: Đối chiếu các đặc điểm độc đáo của việc học của con người LO: Xác định các thuật toán học có giám sát, không giám sát và tăng cường,
(Con người so với máy móc) học. với cách thức hoạt động của các hệ thống máy học. đồng thời đưa ra các ví dụ về quá trình học của con người
tương tự với từng thuật toán.

3- Ăn EU: Máy tính học khác với con người. EU: Cả con người và máy tính đều có thể học bằng cách tìm các mẫu
trong dữ liệu hoặc bằng cách thử và sai. Nhưng mọi người là những EU: Mọi người học bằng cách quan sát, bằng cách được chỉ bảo, EU: Cả thuật toán học có giám sát và không giám sát đều tìm
Unpacked: Mọi người học bằng cách quan sát, bằng cách được nói, bằng người học linh hoạt, những người có thể thích nghi với các tình huống bằng cách đặt câu hỏi, bằng thử nghiệm, bằng thực hành và bằng cách thấy các mẫu trong dữ liệu. Học có giám sát sử dụng các tính năng
cách đặt câu hỏi, bằng thử nghiệm, bằng thực hành và bằng cách kết không quen thuộc và học theo những cách khác, chẳng hạn như bằng cách quan kết nối với kinh nghiệm trong quá khứ. Máy tính học bằng cách áp dụng để dự đoán nhãn lớp do giáo viên cung cấp; học tập không giám sát
nối với kinh nghiệm trong quá khứ. sát người khác, bằng cách đặt câu hỏi hoặc bằng cách tạo mối liên hệ các thuật toán chuyên biệt cho một lượng lớn dữ liệu đào tạo, nhóm các trường hợp tương tự lại với nhau, tạo ra các lớp riêng của
Máy tính học bằng cách tìm các mẫu trong dữ liệu hoặc bằng cách thử với việc học trước đó. hoặc bằng hàng nghìn hoặc thậm chí hàng triệu trải nghiệm thử và nó. Học tăng cường sử dụng phương pháp thử và sai để tìm ra
và sai. sai, để giải quyết các vấn đề được xác định trong phạm vi hẹp. chính sách lựa chọn các hành động nhằm tối đa hóa tín hiệu tăng cường.
Unpacked: Mọi người là những người học tự nhiên, trong khi máy tính phải
Hoạt động: Mô tả thời gian khi bạn học được điều gì đó khi được kể, khi được lập trình để học. Hiện tại, có hai cách mà máy tính có thể được lập
quan sát người khác hoặc khi đặt câu hỏi. Một bản trình diễn chẳng hạn trình để học: chúng có thể học bằng cách tìm các mẫu trong các ví dụ do Unpacked: Mọi người là những người học linh hoạt sử dụng nhiều Giải nén: Học có giám sát giống như được huấn luyện viên sửa lỗi. Học
như Máy có thể dạy được có thể được sử dụng để minh họa việc máy tính con người cung cấp hoặc chúng có thể học bằng cách thử và sai. chiến lược. Máy tính sử dụng các thuật toán chuyên biệt đòi không giám sát giống như nhận thấy rằng cửa hàng của bạn có ba loại
học được điều gì đó từ các ví dụ tích cực và tiêu cực. hỏi lượng dữ liệu lớn hoặc nhiều thử nghiệm và chỉ giải quyết các vấn khách hàng dựa trên các kiểu mua hàng đặc biệt của họ. Học tăng cường
đề được xác định trong phạm vi hẹp. Mặc dù con người có thể xây dựng giống như thử các động tác khác nhau trong trò chơi điện tử và xem
các trình suy luận bằng cách lập trình rõ ràng cho chúng, động tác nào mang lại nhiều điểm nhất (phần thưởng lớn nhất).
nhưng đối với các vấn đề phức tạp, việc để thuật toán học máy thực
hiện công việc thường thuận tiện hơn.
Bản chất của việc học LO: Xác định các mẫu trong dữ liệu được dán nhãn và xác định các tính LO: Lập mô hình cách học có giám sát xác định các mẫu trong dữ liệu được LO: Mô hình hóa cách học không giám sát tìm thấy các mẫu trong dữ liệu LO: Lập mô hình cách máy học xây dựng trình suy luận để phân loại hoặc
(Tìm mẫu trong dữ liệu) năng dự đoán nhãn. dán nhãn. chưa được gắn nhãn. dự đoán bằng cách điều chỉnh các tham số của trình suy luận (biểu diễn
bên trong của nó).

EU: Các lớp có thể được xác định theo các giá trị tính năng. EU: Khi học cách phân loại dữ liệu được dán nhãn, các mẫu (hoặc quy tắc) EU: Học tập không giám sát rất hữu ích khi chúng ta không biết
3-A-ii Các tính năng có liên quan có thể được suy ra bằng cách kiểm tra được phát hiện có thể được biểu thị dưới dạng trọng số trong trước những lớp nào tồn tại. Nó khám phá các mẫu EU: Học có giám sát điều chỉnh các tham số của một (hoặc các lớp) trong dữ liệu bằng cách nhóm
các ví dụ được dán nhãn. mạng thần kinh hoặc các nút trong cây quyết định. các điểm lân cận thành các cụm mô hình toán học (do con người chọn trước). Khi một tập hợp các cụm đã được tìm thấy, mới tạo ra các phân loại
hoặc dự đoán chính xác. Điểm này có thể được phân loại dựa trên khoảng cách từ mô hình có thể là một phương trình tuyến tính đơn giản, một cụm
Unpacked: Để tạo cho học sinh cảm nhận về vấn đề học cách phân loại, Unpacked: Điều này mở rộng phiên bản K-2 bằng cách yêu cầu học ranh giới mức độ cao. đa thức, hoặc một phương trình phi tuyến phức tạp hơn, chẳng hạn như mạng lưới thần kinh sâu. Các biểu diễn bên trong mã
chúng ta phải yêu cầu họ học một lớp không rõ ràng bằng trực giác, ví sinh vẽ cây quyết định thay vì chỉ nói thành lời quy tắc đề hóa mối quan hệ giữa đầu vào và đầu ra thể hiện các "mẫu" được tìm thấy trong dữ liệu.
dụ: học "cá độc" bằng cách kiểm tra các hình ảnh hoạt hình về cá được xuất của chúng. Ngoài ra, nhiệm vụ có thể được thực hiện phong phú hơn
dán nhãn "độc" hoặc "không độc". Sau đó, họ có thể được yêu cầu mô tả trong 3-5 bằng cách tăng số lượng lớp hoặc bằng cách làm cho các Giải nén: Điều này có thể được thực hiện bằng đồ họa bằng cách sử dụng
những đặc điểm nào cho thấy một con cá có độc, ví dụ: cá đỏ đầu định nghĩa lớp phức tạp hơn. các điểm trong mặt phẳng và xây dựng các ranh giới cụm một cách trực quan
vuông. Sử dụng hình ảnh làm đầu vào đơn giản hóa nhiệm vụ vì các tính Ví dụ, một con cá có thể độc nếu nó có màu đỏ với đầu vuông hoặc màu bằng cách phác thảo (ví dụ: vẽ một hình elip xung quanh) mỗi cụm.
năng trực quan, mặc dù quy tắc phân loại không nên như vậy. xanh lam với đầu tròn hoặc màu tím với gai nhọn và đầu có hình dạng bất
kỳ. Mỗi nút của cây quyết định có thể kiểm tra một giá trị tính năng, Giải nén: Trong hồi quy, chúng tôi chọn một mô hình toán học, chẳng hạn
ví dụ: màu sắc, vì vậy các tính năng phức tạp yêu cầu cây sâu hơn. như phương trình tuyến tính y=mx+b, sau đó điều chỉnh các tham số
của nó để phù hợp nhất có thể với một tập hợp các điểm dữ liệu. Sau đó,
mô hình có thể được sử dụng để dự đoán giá trị ay cho bất kỳ giá trị
x nào.
Hồi quy tuyến tính có thể được thực hiện bằng thước kẻ bằng cách đánh
dấu khoảng cách giữa đường thẳng và các điểm. Học sinh có thể lập mô
hình hồi quy đa thức hoặc logistic bằng cách cung cấp cho họ một màn
hình đồ họa với các thanh trượt để kiểm soát các giá trị tham
số. Họ có thể điều chỉnh các thanh trượt theo cách thủ công để đạt
được những gì họ cho là phù hợp nhất với dữ liệu.
Học sinh cao cấp hơn có thể được chỉ ra cách đo lường chất lượng phù
hợp bằng toán học bằng cách sử dụng sai số bình phương trung bình.
Đối với các bài toán phân loại, giá trị Y là 1 cho "trong lớp" hoặc 0
cho "không thuộc lớp" và ranh giới quyết định là đường hoặc bề
mặt y=0,5.
V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 2

Có thể thay đổi dựa trên phản hồi của công chúng

LO = Mục tiêu học tập: Học EU = Hiểu biết lâu dài: Mô tả giải nén được bao gồm khi cần thiết để minh họa LO hoặc EU
Học hỏi Máy tính có thể học hỏi từ dữ liệu. sinh có thể làm gì. Những điều học sinh nên biết.
Ý tưởng K-2 3-5 6-8 9-12
Bản chất của việc học LO: Trình bày cách đào tạo máy tính để nhận dạng một thứ gì đó. LO: Huấn luyện một mô hình phân loại bằng cách sử dụng máy học, sau LO: Huấn luyện và đánh giá mô hình phân loại hoặc dự đoán bằng LO: Sử dụng thuật toán học có giám sát hoặc không giám sát để đào
(Đào tạo người mẫu) đó kiểm tra độ chính xác của mô hình trên các đầu vào mới. cách sử dụng máy học trên tập dữ liệu dạng bảng. tạo một mô hình trên dữ liệu trong thế giới thực, sau đó
đánh giá kết quả.
3-A-iii EU: Máy tính có thể học hỏi từ các ví dụ. Châu Âu: Máy tính có thể học cách phân loại phiên bản hoặc dự đoán
EU: Máy tính có thể học cách phân loại các phiên bản hoặc dự đoán giá trị bằng cách kiểm tra giá trị tính năng. Nếu kết quả trên đầu EU: Trong học có giám sát, mô hình được đào tạo trên một tập
Đã giải nén: Với sự hỗ trợ của người hướng dẫn, Máy có thể giá trị bằng cách hiển thị các ví dụ được gắn nhãn. Nếu kết quả vào mới không đạt yêu cầu, có thể cần đào tạo thêm để cải thiện huấn luyện để tạo nhãn chính xác cho dữ liệu được dán nhãn.
dạy được có thể được sử dụng để nhận dạng cử chỉ hoặc âm thanh trên đầu vào mới không đạt yêu cầu, có thể cần đào tạo thêm để cải độ chính xác. Chúng tôi đánh giá kết quả bằng cách đo phần trăm các mục trong
của bàn tay. thiện độ chính xác. bộ kiểm tra được dán nhãn chính xác. Trong Unpacked:
Trong tập dữ liệu dạng bảng, mỗi lần huấn luyện học tập không giám sát, mô hình được huấn luyện để gán ví dụ là một hàng trong bảng và
Hoạt động: Sử dụng Máy có thể dạy hoặc Máy học cho trẻ em, các ví dụ được mô tả bằng một tập hợp từng đầu vào cho một cụm đầu vào tương tự. Các cụm là giá trị tính năng; các tính năng là các cột của bảng.
đào tạo có thể được cung cấp bằng đầu vào webcam hoặc được thu được xác định bởi thuật toán học vì không có Phân loại gán mỗi ví dụ cho một trong các nhãn riêng biệt được gắn vào dữ liệu huấn luyện.
thập từ tìm kiếm hình ảnh trên web và mô hình có thể được đào tạo Chúng tôi đánh giá tập hợp các lớp (ví dụ: con mèo hoặc con chó); dự đoán đưa ra kết quả bằng cách kiểm tra các cụm để xem liệu chúng
về một nhiệm vụ chẳng hạn như nhận dạng hình ảnh của mèo. có nắm bắt được giá trị liên tục hay không, chẳng hạn như dự đoán sự khác biệt hữu ích về chiều cao của một người trong tập dữ liệu.
từ tuổi của họ. Thuật toán học có thể là một trình học cây quyết
định hơn là một mạng lưới thần kinh. Giải nén: Cả thuật toán học có giám sát và không giám sát đều tìm
thấy các mẫu trong dữ liệu. Trong học tập có giám sát, Hoạt động:
Các trang web như MachineLearningForKids và "mẫu" là mối quan hệ giữa các giá trị tính năng eCraft2Learn bao gồm học tập cây quyết định.
Các nhãn học tập và lớp học. Trong học tập không giám sát, mẫu là thuật toán chỉ ra đâu là các tính năng có liên quan và cách dữ liệu đó
được nhóm thành các cụm. Thế giới thực họ nên có những giá trị nào cho mỗi lớp.
bộ dữ liệu hiện có sẵn rộng rãi trên web. Ở các nhóm lớp trước, học
sinh có thể kiểm tra các mô hình được đào tạo của mình trên một vài
điểm dữ liệu mới, nhưng ở nhóm lớp này, học sinh được yêu cầu đo
lường một cách định lượng hiệu suất của một mô hình được đào tạo
trên một bộ kiểm tra không cần thiết.
Bản chất của việc học không áp dụng

LO: Trình bày cách dữ liệu đào tạo được gắn nhãn khi sử dụng LO: Giải thích sự khác biệt giữa đào tạo và sử dụng mô hình lập luận. LO: Minh họa điều gì xảy ra trong từng bước cần thiết khi sử
(Xây dựng so với sử dụng lý do) công cụ máy học. dụng máy học để xây dựng bộ phân loại hoặc bộ dự đoán.
EU: Để chuẩn bị cho việc đào tạo một mô hình, dữ liệu đào tạo có thể EU: Các thuật toán học máy sử dụng dữ liệu huấn luyện được gắn
3-A-iv được gắn nhãn bằng cách xác định các lớp (nhãn) trước tiên và sau nhãn để xây dựng các mô hình suy luận phân loại hoặc dự đoán. Trong EU: Các bước là: quyết định vấn đề bạn muốn giải quyết, tìm ra
đó thêm các ví dụ cho từng lớp riêng biệt. Sau khi đào tạo, dữ quá trình đào tạo, mô hình lập luận chạy trên đầu vào đào tạo và nơi bạn sẽ lấy dữ liệu đào tạo, chọn bộ tính năng, tìm cách gắn nhãn
liệu mới có thể được trình bày cho mô hình và nó sẽ dự đoán lớp, thuật toán học điều chỉnh mô hình để làm cho đầu ra của nó khớp với dữ liệu, chạy thuật toán học tập, sử dụng bộ xác thực chéo để quyết
nhưng dữ liệu không được gắn nhãn nên mô hình không nhận được nhãn hơn. Sau khi đào tạo hoàn tất, mô hình lý luận có thể được định khi nào nên dừng đào tạo và sử dụng bộ kiểm tra để đo lường
phản hồi về tính chính xác của dự đoán lớp của nó. áp dụng cho dữ liệu mới để giải quyết vấn đề hoặc đưa ra quyết hiệu suất.
định. Sử dụng một mô hình lý luận được đào tạo theo cách này không
thay đổi nó; chỉ thuật toán học mới có thể thay đổi mô hình.
Đã giải nén: Máy có thể dạy được cung cấp ba lớp theo mặc định và Đã giải nén: Bộ xác thực chéo được sử dụng để tránh trang bị
có nút "Giữ để ghi" riêng cho mỗi lớp, vì vậy các ví dụ đào tạo quá mức. Bộ kiểm tra bao gồm các ví dụ không được sử dụng trong
được gắn nhãn ngầm dựa trên lớp mà chúng được ghi lại. Sau khi đào quá trình đào tạo hoặc để xác thực chéo, do đó, nó cung cấp dự
tạo, mô hình đang phân loại đầu vào webcam trong thời gian đoán khách quan về hiệu suất của người lập luận đối với các
thực nhưng không nhận được phản hồi. đầu vào mới.


Ý tưởng K-2 3-5 6-8 9-12

LO: Phân tích trò chơi trong đó một người xây dựng cây quyết LO: So sánh cách hoạt động của thuật toán học cây quyết định LO: Mô tả cách các loại thuật toán học máy khác nhau học bằng
(Điều chỉnh biểu diễn định, mô tả tổ chức của cây và thuật toán học được sử dụng với cách hoạt động của thuật toán học mạng thần kinh. cách điều chỉnh các biểu diễn bên trong của chúng.
bên trong) để thêm các nút.
3-Tắt EU: Trong trò chơi học cây quyết định, các nút nhánh của cây là EU: Trong học cây quyết định, mỗi bước thêm một nút mới, kiểm EU: Người học cây quyết định xây dựng cây quyết định bằng cách thêm
các câu hỏi và các nút lá là các lớp. Thuật toán học di chuyển qua tra một giá trị tính năng duy nhất. Trong học mạng thần từng nút một. Các thuật toán học mạng nơ-ron điều chỉnh trọng
cây bằng cách đặt câu hỏi tại các nút nhánh (kiểm tra các tính kinh, mỗi bước tạo ra một thay đổi nhỏ đối với mọi trọng số số. Các thuật toán hồi quy điều chỉnh các tham số của phương
năng của đầu vào) cho đến khi nó đến nút lá. Nếu lớp của nút lá trong mạng. trình. Học viên củng cố cập nhật các dự đoán hoặc chính
đó không chính xác, nút đó sẽ được thay thế bằng nút nhánh có sách giá trị.
câu hỏi mới và nút lá được gắn lại tại nhánh đó. Giải nén: Biểu diễn bên trong của cây quyết định là các nút, tính
năng mà mỗi nút kiểm tra và giá trị mà tính năng được so sánh
với. Các biểu diễn bên trong của mạng nơ-ron là các
trọng số.
Hoạt động: trò chơi "đoán con vật", khắc phục sự cố và hoạt động Các thuật toán học cây quyết định cố gắng tìm, đối với mỗi nút mới
Pasta Land là những lựa chọn tốt để thể hiện việc học cây quyết mà chúng tạo, tính năng nhiều thông tin nhất để kiểm tra.
định. Thay đổi dữ liệu đào tạo có thể dẫn đến một lựa chọn tính
năng khác để kiểm tra tiếp theo. Với mạng thần kinh, việc
thay đổi dữ liệu huấn luyện sẽ dẫn đến các điều chỉnh trọng số
khác nhau khi thuật toán cố gắng giảm tín hiệu lỗi.

LO: Giải thích cách học tăng cường cho phép máy tính học LO: Giải thích sự khác biệt giữa học có giám sát và học tăng cường. LO: Chọn loại thuật toán học máy thích hợp (học có giám sát,
(Rút kinh nghiệm) hỏi từ kinh nghiệm (nghĩa là thử và sai). không giám sát hoặc học tăng cường) để giải quyết vấn đề lý luận.
EU: Máy tính có thể rút kinh nghiệm nếu có tín hiệu "củng cố" EU: Học có giám sát cho tác nhân biết đầu ra mà nó sẽ tạo ra
3-a-you cho biết hành động của máy tính dẫn đến kết quả tốt hay xấu. cho mỗi đầu vào; học tăng cường chỉ cho tác nhân biết nó hoạt EU: Các loại thuật toán học tập chính và các loại vấn đề lý luận
động tốt như thế nào khi nó chọn các hành động để thực hiện. mà chúng được sử dụng để giải quyết là: học có giám
sát, được sử dụng để phân loại và dự đoán; học tập
Đã giải nén: Máy tính có thể học cách chơi trò chơi bằng cách sử không giám sát, được sử dụng để phân cụm; và học tăng cường,
dụng tín hiệu củng cố cho biết máy tính thắng hay thua trong trò Unpacked: Trong học tập có giám sát, giáo viên chỉ ra đầu ra chính được sử dụng để ra quyết định tuần tự.
chơi gần đây nhất hoặc số điểm mà máy tính đã ghi được. Máy tính xác cho mỗi ví dụ đào tạo, vì vậy thuật toán học tập có thể
có thể phải chơi hàng trăm nghìn trò chơi để trở thành một thấy nó đang làm sai điều gì. Trong học tăng cường, tín hiệu
người chơi lão luyện. tăng cường cho biết mô hình đang hoạt động tốt như thế Giải nén: Cả thuật toán học có giám sát và không giám sát đều tìm
nào, nhưng không cho thuật toán học biết những hành động mà mô thấy các mẫu trong dữ liệu. Các thuật toán được giám sát sử dụng
Trình diễn: Học tăng cường có thể được minh họa bằng hình nên chọn để làm tốt hơn. Điều này phải được phát hiện bằng dữ liệu huấn luyện được gắn nhãn và điều chỉnh các tham số
cách sử dụng một tác nhân điều hướng qua thế giới dạng lưới với cách thử và sai, vì vậy có thể mất hàng trăm nghìn lần thử để của mô hình lý luận để cố gắng tạo ra các nhãn chính xác.
các chướng ngại vật và mối nguy hiểm; nhiệm vụ là tìm hiểu con đạt được hiệu suất ở cấp độ chuyên gia. Ví dụ: khi chơi trò Chúng được sử dụng cho các vấn đề phân loại hoặc dự đoán.
đường tốt nhất đến một vị trí mục tiêu. Tại mỗi ô vuông chơi điện tử, tín hiệu củng cố có thể là số điểm ghi được. Bởi
lưới, các hành động được phép là di chuyển N/S/E/W. Qua nhiều vì máy tính học hỏi từ kinh nghiệm của chính nó, nên học tăng Các thuật toán học không giám sát. sử dụng dữ liệu chưa được gắn
lần thử nghiệm, tác nhân học được nước đi tốt nhất để thực cường có thể tìm ra giải pháp cho các vấn đề mà không có nhãn, hãy cố gắng nhóm các điểm dữ liệu tương tự lại với nhau.
hiện trong mỗi ô vuông. giáo viên nào có thể cho nó biết hành động tốt nhất nên thực hiện. Chúng được sử dụng để khám phá các lớp trong dữ liệu. Các
thuật toán học tăng cường được sử dụng cho các vấn đề quyết
định tuần tự. Họ tìm hiểu các chính sách để lựa chọn các hành
động tối đa hóa sự củng cố mà mô hình sẽ nhận được.
Học tăng cường có thể chậm vì việc học phải tiến hành bằng thử
và sai; không có giáo viên nói với thuật toán hành động tốt
nhất ở mỗi bước. Nhưng để máy tính học hỏi từ kinh nghiệm của
chính nó có lợi thế là nó có thể khám phá ra các giải pháp cho các
vấn đề mà nó không biết trước đâu là hành động tốt nhất.


Ý tưởng K-2 3-5 6-8 9-12
Mạng thần kinh không áp dụng LO: Minh họa cách mạng nơ-ron từ 1 đến 3 nơ-ron là một hàm tính LO: Minh họa cấu trúc của mạng thần kinh và mô tả cách các LO: Mô tả các kiến trúc mạng thần kinh sau đây và cách sử dụng
(Cấu trúc của một mạng toán đầu ra. bộ phận của nó tạo thành một tập hợp các hàm tính toán đầu chúng: mạng chuyển tiếp, mạng tích chập 2D, mạng hồi quy, mạng
lưới thần kinh) ra. đối nghịch tổng quát.
EU: Mạng nơ-ron sử dụng một hoặc nhiều nơ-ron làm việc cùng nhau để
3-Với tạo thành một chức năng. Mỗi nơ-ron lấy một tập hợp các số làm
đầu vào và tạo ra một số duy nhất làm đầu ra của nó. EU: Mạng nơ-ron được tổ chức dưới dạng các lớp đơn vị (lớp EU: Các mạng chuyển tiếp nguồn cấp dữ liệu có thể học các chức năng
đầu vào, lớp ẩn và lớp đầu ra), với các kết nối có trọng tùy ý và được sử dụng cho cả phân loại và hồi quy. Các mạng
số giữa các đơn vị trong các lớp liên tiếp. Mỗi đơn vị tính tích chập 2D học các "hạt nhân" nhỏ được tích hợp với đầu vào
Giải nén: Mạng nơ-ron là tập hợp các nơ-ron được kết nối với tổng các đầu vào có trọng số của nó. Nó chuyển tổng đó qua một và các lớp tổng hợp tối đa để giảm độ phân giải hình ảnh;
nhau. Mỗi nơ-ron có một tập hợp các kết nối đầu vào, mỗi kết nối có hàm truyền để tạo ra một đầu ra số. chúng được sử dụng để phân tích hình ảnh. Các mạng hồi quy
một trọng số kèm theo. Mỗi kết nối đầu vào mang một giá trị. Tế bào có các kết nối phản hồi và được sử dụng để xử lý ngôn ngữ. Các mạng
thần kinh nhân mỗi giá trị đầu vào với trọng số kết nối để tạo ra đối thủ tạo có các mô-đun trình tạo và phân biệt đối xử và
đầu vào có trọng số. Tổng của tất cả các đầu vào có trọng số được Giải nén: Mạng thần kinh ánh xạ các mẫu đầu vào thành các mẫu được sử dụng để tạo các tác phẩm sâu.
so sánh với giá trị ngưỡng của nơ-ron. Nếu tổng cao hơn giá đầu ra theo một cách phức tạp. Mỗi nơ-ron tính toán một
trị ngưỡng, nơ-ron sẽ xuất ra 1; ngược lại, nó cho kết quả là 0. hàm và toàn bộ mạng tính toán một hàm phức tạp có thể được
Giá trị đầu ra có thể được sử dụng làm đầu vào cho các nơ- coi là một hàm toán học rất phức tạp.
ron khác.
Hoạt động: Tính toán đầu ra của một nơ-ron đơn lẻ có nhiều đầu
vào hoặc mạng gồm hai nơ-ron "ẩn" nhiều đầu vào cung cấp một nơ-
ron đầu ra duy nhất. Các mạng như vậy có thể tính toán các hàm
đơn giản như "VÀ", "HOẶC" hoặc "ít nhất 2 trên 3". Để có hướng
dẫn nhanh về mạng lưới thần kinh dành cho lớp 3-5, hãy xem https://
docs.google.
com/tài liệu/d/1bYs0tTiL44sQhsMADgU2bDmVjWaV
KVl2pT_SYZTzEwI/edit#heading=h.g640mybwbie6
Mạng thần kinh không áp dụng

LO: Trình bày cách gán trọng số trong mạng thần kinh để tạo ra LO: Trình bày cách sử dụng quy tắc học để điều chỉnh trọng số LO: Huấn luyện mạng nơ-ron nhiều lớp bằng cách sử dụng
(Điều chỉnh trọng lượng) hành vi đầu vào/đầu ra mong muốn. trong mạng nơ-ron một lớp. thuật toán học lan truyền ngược và mô tả trọng số của nơ-ron và
đầu ra của các đơn vị ẩn thay đổi như thế nào khi học.
3-B-ii EU: Hành vi của mạng thần kinh có thể được thay đổi bằng cách EU: Trong quá trình đào tạo, các trọng số được điều chỉnh để đáp
điều chỉnh trọng số của nó. ứng với các lỗi trong đầu ra của mạng, do đó sẽ ít xảy ra lỗi
hơn khi đầu vào được nhìn thấy lại. EU: Trọng số của nơ-ron bắt đầu bằng các giá trị ngẫu nhiên nhỏ và
phát triển thành một mẫu chính xác hơn thông qua học tập.
Giải nén: Có thể thực hiện huấn luyện bằng cách sử dụng các đơn vị Những thay đổi về trọng số của nơ-ron được tính toán theo quy tắc
nhị phân và quy tắc học đơn giản để điều chỉnh trọng số (chẳng hạn học được điều khiển bởi tín hiệu lỗi lan truyền ngược.
như quy tắc học perceptron trong bài tập "Con chó này có cắn Mẫu trọng lượng của nơ-ron xác định các tính năng mà nơ-ron phát
tôi không?"). hiện.
Unpacked: Học sinh không cần phải biết chi tiết về thuật
toán học lan truyền ngược, chỉ lỗi đó được truyền ngược từ lớp
sau sang lớp trước.
Hoạt động: Có thể sử dụng bản trình diễn trực tuyến

như TensorFlow Playground để trực quan hóa các thay đổi về
trọng số trong quá trình học.
V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 Có thể thay đổi dựa trên phản hồi của công chúng 5

Ý tưởng K-2 3-5 6-8 9-12
Bộ dữ liệu LO: Tạo tập dữ liệu được gắn nhãn với các tính năng rõ ràng để LO: Tạo tập dữ liệu được gắn nhãn với các tính năng rõ ràng của LO: Tạo tập dữ liệu để đào tạo bộ phân loại hoặc bộ dự đoán LO: So sánh hai bộ dữ liệu trong thế giới thực về các tính năng
(Bộ tính năng) minh họa cách máy tính có thể học cách phân loại những thứ như đồ một số loại và sử dụng công cụ máy học để đào tạo trình phân loại cây quyết định và khám phá tác động của các mã hóa tính năng mà chúng bao gồm và cách các tính năng đó được mã hóa.
ăn, phim ảnh hoặc đồ chơi. trên dữ liệu này. khác nhau đối với cây quyết định.
3-Có
EU: Chúng ta có thể nhờ máy tính phân loại mọi thứ bằng EU: Các loại đối tượng địa lý bao gồm các giá trị rời rạc (ví dụ: EU: Việc lựa chọn các tính năng để đưa vào và mã hóa tốt nhất EU: Con người quyết định những tính năng nào sẽ được đưa
cách mô tả chúng theo các giá trị đặc trưng mà máy tính có thể suy "New York", "Pennsylvania", "Iowa"), giá trị nhị phân (có/không) và để sử dụng cho các tính năng này, tùy thuộc vào vấn đề lý luận vào tập dữ liệu và cách mã hóa chúng. Điều này có thể gây
luận. Mọi người chọn các tính năng. giá trị liên tục (tuổi, chiều cao). cụ thể mà chúng tôi đang cố gắng giải quyết. ra hậu quả đối với các thuật toán máy học được đào tạo trên các bộ
dữ liệu này.
Chưa đóng gói: Phân loại thực phẩm là tốt cho sức khỏe/không Đã giải nén: Các trang web như MachineLearningForKids sẽ huấn luyện Giải nén: Tại mỗi nút của cây quyết định, thuật toán học cố
tốt cho sức khỏe hoặc phân loại đồ chơi là an toàn hoặc không an bộ phân loại cây quyết định dựa trên dữ liệu thuộc loại này. gắng chọn một tính năng hữu ích nhất trong việc tách các phiên bản còn Giải nén: tuổi có thể được mã hóa theo tháng (đối với bộ dữ liệu nhi
toàn cho trẻ sơ sinh. Theo tùy chọn, họ có thể tạo cây quyết định lại thành các lớp khác nhau. Các tính năng không tương quan khoa), năm (đối với người lớn) hoặc độ tuổi (trẻ sơ sinh, trẻ em,
bằng cách sử dụng các tính năng này, nhưng điều quan trọng nhất cần chặt chẽ với bất kỳ lớp nào sẽ không được chọn. thanh thiếu niên, người lớn, người cao tuổi, người cao tuổi).
hiểu là họ có thể cung cấp dữ liệu của mình cho thuật toán Việc mã hóa một biến liên tục bằng cách sử dụng các giá trị rời rạc
máy học để tạo cây quyết định cho họ. có thể hướng dẫn thuật toán học tập tạo ra sự khác biệt phù hợp
Tài nguyên: MachineLearningForKids sẽ vẽ cây quyết định để với sự hiểu biết của con người về miền.
học sinh có thể kiểm tra và xem tính năng nào được tham chiếu tại
mỗi nút.
Bộ dữ liệu không áp dụng

LO: Minh họa cách đào tạo một bộ phân loại cho một khái niệm rộng LO: Minh họa cách các đối tượng trong một hình ảnh có thể được phân đoạn LO: Đánh giá một tập dữ liệu được sử dụng để đào tạo một hệ thống AI thực
(Bộ dữ liệu lớn) bằng cách chẳng hạn như "chó" yêu cầu một lượng lớn dữ liệu để thu thập và gắn nhãn để xây dựng một tập huấn luyện cho đối tượng xem xét kích thước của tập dữ liệu, cách dữ liệu thể hiện tính đa dạng của miền.
sự công nhận. đã được mua và dán nhãn, dung lượng lưu trữ cần thiết và thời gian
3-C-ii ước tính để tạo tập dữ liệu.
EU: Máy học đòi hỏi lượng lớn dữ liệu EU: Máy học đòi hỏi lượng lớn dữ liệu để có hiệu quả. Để nhận ra những con chó trong hình ảnh, người
ta phải có hiệu quả. Chuyên môn của con người thường được yêu cầu để dán nhãn không chỉ cho nhiều loại chó mà còn cho nhiều dữ liệu khác EU: Một bộ dữ liệu lớn thường được yêu cầu để nắm bắt được tính
nhau, điều này có thể tốn nhiều công sức. đa dạng của một miền phức tạp và thu hẹp phạm vi các hành vi có
góc nhìn và bối cảnh. thể có của người suy luận. Có nhiều lần giải nén: Học sinh có thể
được cung cấp một tập hợp hình ảnh và các cách để xây dựng, làm sạch và xác minh tập dữ liệu. Có thể yêu cầu vẽ một hộp giới hạn xung quanh
Giải nén: Một cách để giúp sinh viên hình dung ra sự đa dạng mỗi người, chó, chi phí lớn liên quan đến việc tạo tập dữ liệu và hoặc biển báo giao thông trong hình ảnh và gắn nhãn đối tượng xử lý dữ
cần thiết là duyệt qua một số bộ dữ liệu tiêu chuẩn được sử liệu. Ghi nhãn dữ liệu đào tạo là lao động một cách thích hợp. Để theo dõi, sinh viên có thể được yêu cầu chuyên sâu và có thể yêu cầu
dụng để nhận dạng đối tượng, chẳng hạn như ImageNet hoặc Coco. chuyên môn chuyên môn (ví dụ: ước tính thời gian cần thiết để xây dựng một bệnh đốm được dán nhãn trong tia X). Có thể giới thiệu bộ dữ
liệu thiên vị với vài nghìn ví dụ.
trong mỗi bước tạo tập dữ liệu.
Đã giải nén: Bộ dữ liệu cho các vấn đề trong thế giới thực có
thể liên quan đến nhiều tính năng và các đặc điểm xác định của một lớp
có thể liên quan đến các mối quan hệ tổng hợp giữa các tính năng
này. Để thu hẹp lớp cần học và phân biệt nó với hàng triệu lớp khả dĩ
khác, thuật toán học phải xem nhiều ví dụ.
Hoạt động: Một hoạt động có thể được thực hiện với bộ dữ liệu máy học
phổ biến được tìm thấy trong các kho lưu trữ như Kaggle hoặc bộ
dữ liệu nhân khẩu học, kinh tế hoặc môi trường có sẵn công
khai.


LO = Mục tiêu học tập: Học sinh EU = Hiểu biết lâu dài: Mô tả giải nén được bao gồm khi cần thiết để minh họa LO hoặc EU
Học hỏi Máy tính có thể học hỏi từ dữ liệu. có thể làm gì. Những điều học sinh nên biết.
Ý tưởng K-2 3-5 6-8 9-12
Bộ dữ liệu LO: Kiểm tra tập dữ liệu được dán nhãn và xác định các vấn đề trong dữ LO: Kiểm tra các tính năng và nhãn của dữ liệu huấn luyện để phát LO: Giải thích cách lựa chọn dữ liệu huấn luyện định hình hành vi của bộ LO: Điều tra sự mất cân bằng trong dữ liệu đào tạo về giới tính, tuổi
(Thiên kiến) liệu có thể khiến máy tính đưa ra dự đoán sai. hiện các nguồn sai lệch tiềm ẩn. phân loại và cách sai lệch có thể được đưa ra nếu tập huấn tác, dân tộc hoặc các biến nhân khẩu học khác có thể dẫn đến mô hình
luyện không được cân bằng hợp lý. sai lệch bằng cách sử dụng công cụ trực quan hóa dữ liệu.
3-C-iii EU: Các thuật toán học máy yêu cầu thu thập dữ liệu đại diện để xây dựng
EU: Máy tính học cách phân loại tốt như thế nào phụ thuộc vào dữ liệu một mô hình chính xác. EU: Có thể xảy ra sai lệch nếu mô hình được yêu cầu phân loại đầu
được sử dụng để huấn luyện nó. Tập dữ liệu đào tạo được rút ra từ dữ liệu lịch sử có thể phản ánh những vào không giống với dữ liệu đào tạo hoặc nếu dữ liệu đào tạo chứa EU: Các thuật toán học máy sẽ tận dụng mọi sự mất cân bằng hoặc tương
thành kiến xã hội và con người đã tồn tại từ trước. các mối tương quan không liên quan mà chúng tôi không muốn bộ phân quan trong tập huấn luyện để giúp giảm tỷ lệ lỗi. Nếu tập dữ liệu
Unpacked: Nếu ví dụ về thực phẩm tốt cho sức khỏe là bông cải xanh, loại dựa vào. không mang tính đại diện, những mối tương quan đó có thể
đậu xanh, đậu Hà Lan và rau bina (tất cả đều có màu xanh) và Unpacked: Công cụ sắp xếp sơ yếu lý lịch của Amazon đã học được sự gây hiểu lầm
thực phẩm không tốt cho sức khỏe là bánh rán, bánh ngọt và thanh kẹo, thì thiên vị đối với các ứng viên nữ vì nó được đào tạo để bắt chước Unpacked: Một trình phân loại chỉ được đào tạo trên khuôn mặt của người
máy tính sẽ kết luận gì về kẹo dẻo xanh? số liệu thống kê về lịch sử tuyển dụng trong quá khứ. da trắng sẽ hoạt động kém trên khuôn mặt của người da đen hoặc người châu Unpacked: Việc khám phá dữ liệu để giúp học sinh phát hiện ra sự mất
Á. Một bộ phân loại được đào tạo về bộ dữ liệu đơn xin vay tiền mà hầu cân bằng hoặc mối tương quan có thể được thực hiện bằng cách sử dụng biểu
hết những người nộp đơn bị từ chối đều sống ở Pleasntville có thể đồ trong Excel hoặc sử dụng bất kỳ công cụ trực quan hóa dữ liệu nào như
quyết định không bao giờ cho bất kỳ ai sống ở Pleasantville vay tiền. Pandas (dành cho Python).


AI4K12 Big Idea 3 Progression Chart Working Draft of Big Idea 3 v.11.19.2020

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

AI4K12 Big Idea 3 Progression Chart Working Draft of Big Idea 3 v.11.19.2020

Uploaded by

Copyright:

Available Formats

Machine Translated by Google

Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org

Ý tưởng lớn #3: Học tập

Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org

Ý tưởng lớn #3:

Ý tưởng K-2 3-5 6-8 9-12

tương tự với từng thuật toán.

hiện công việc thường thuận tiện hơn.

bên trong của nó).

được những gì họ cho là phù hợp nhất với dữ liệu.

V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 2

Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org

Ý tưởng lớn #3:

Ý tưởng K-2 3-5 6-8 9-12

Bản chất của việc học không áp dụng

V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 3

Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org

Ý tưởng lớn #3:

Ý tưởng K-2 3-5 6-8 9-12

Bản chất của việc học không áp dụng

Bản chất của việc học không áp dụng

V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 4

Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org

Ý tưởng lớn #3:

Ý tưởng K-2 3-5 6-8 9-12

Mạng thần kinh không áp dụng

Hoạt động: Có thể sử dụng bản trình diễn trực tuyến

Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org

Ý tưởng lớn #3:

Ý tưởng K-2 3-5 6-8 9-12

Bộ dữ liệu không áp dụng

trong mỗi bước tạo tập dữ liệu.

khác, thuật toán học phải xem nhiều ví dụ.

V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 6

Dự Thảo Ý Tưởng Lớn 3 - Biểu Đồ Tiến Triển www.AI4K12.org

Ý tưởng lớn #3:

Ý tưởng K-2 3-5 6-8 9-12

V.0.1 - Phát hành ngày 19 tháng 11 năm 2020 7

You might also like