You are on page 1of 14

Machine Translated by Google

Sự bền vững

Bài báo

Mô hình phân loại hình ảnh trái cây dựa trên MobileNetV2 với
Kỹ thuật học chuyển giao sâu
Yonis Gulzar

Khoa Hệ thống Thông tin Quản lý, Trường Quản trị Kinh doanh, Đại học King Faisal, Al-Ahsa 31982, Ả-rập Xê-út;
ygulzar@kfu.edu.sa; Điện thoại: +966-545-719-118

Tóm tắt: Do sự xuất hiện và phát triển nhanh chóng của các ứng dụng AI, việc sử dụng các thiết bị
hình ảnh thông minh đã tăng lên đáng kể. Các nhà nghiên cứu đã bắt đầu sử dụng các mô hình học
sâu, chẳng hạn như CNN, để phân loại hình ảnh. Không giống như các mô hình truyền thống, đòi hỏi
rất nhiều tính năng để hoạt động tốt, CNN không yêu cầu bất kỳ tính năng thủ công nào để hoạt động
tốt. Nó sử dụng nhiều bộ lọc, tự động trích xuất các tính năng cần thiết từ hình ảnh để phân loại.
Một trong những vấn đề của ngành vườn là phân loại trái cây, đòi hỏi chuyên gia có nhiều kinh nghiệm.
Để khắc phục vấn đề này, cần có một hệ thống tự động có thể phân loại các loại trái cây khác nhau
mà không cần bất kỳ nỗ lực nào của con người. Trong nghiên cứu này, một bộ dữ liệu gồm tổng cộng
26.149 hình ảnh của 40 loại trái cây khác nhau đã được sử dụng để thử nghiệm. Tập huấn luyện và tập
kiểm tra được tạo lại ngẫu nhiên và chia theo tỷ lệ 3:1. Thử nghiệm giới thiệu một đầu tùy chỉnh
gồm năm lớp khác nhau vào kiến trúc MobileNetV2. Lớp phân loại của mô hình MobileNetV2 được thay
thế bằng phần đầu tùy chỉnh, tạo ra phiên bản sửa đổi của MobileNetV2 có tên là TL-MobileNetV2.
Ngoài ra, học chuyển giao được sử dụng để giữ lại mô hình được đào tạo trước. TL-MobileNetV2 đạt
độ chính xác 99%, cao hơn 3% so với MobileNetV2 và tỷ lệ lỗi tương đương của TL-MobileNetV2 chỉ
là 1%. So với AlexNet, VGG16, InceptionV3 và ResNet, độ chính xác cao hơn lần lượt là 8, 11, 6 và
10%. Hơn nữa, mẫu TL-MobileNetV2 đạt được độ chính xác 99%, khả năng thu hồi 99% và điểm F1 99%.
Có thể kết luận rằng học chuyển đổi đóng một vai trò quan trọng trong việc đạt được kết quả tốt
hơn và kỹ thuật bỏ học giúp giảm thiểu tình trạng trang bị quá mức trong học chuyển đổi.

Từ khóa: học sâu; phân loại; trái cây; MobileNetV2; nông nghiệp chính xác

Trích dẫn: Gulzar, Y. Hình ảnh trái cây

Mô hình phân loại dựa trên

MobileNetV2 với kỹ thuật Deep Transfer


1. Giới thiệu
Learning. Tính bền vững 2023, 15, 1906.

https://doi.org/ Trí tuệ nhân tạo đang trở thành một động lực trong mọi khía cạnh của cuộc sống, và
10.3390/su15031906 các ngành công nghiệp thực phẩm và văn hóa nông nghiệp cũng không hề kém cạnh. Trí tuệ
nhân tạo đã được sử dụng trong nhiều lĩnh vực như y tế, giáo dục, nông nghiệp và nhiều
Biên tập học thuật: Gwanggil Jeon

lĩnh vực khác. Trong lĩnh vực chăm sóc sức khỏe, AI đã được sử dụng để chẩn đoán nhiều
Nhận: ngày 21 tháng 12 năm 2022
bệnh, chẳng hạn như bệnh ung thư da [1], xác định các đối tượng giải phẫu khác nhau [2],
Sửa đổi: ngày 9 tháng 1 năm 2023
dự đoán rối loạn phát triển thần kinh ở trẻ em [3], sức khỏe tâm thần và các vấn đề khác
Chấp nhận: ngày 17 tháng 1 năm 2023
[4 ,5]. Khi nói đến nông nghiệp, thế giới đang phải đối mặt với những thách thức, chẳng
Đã xuất bản: 19 tháng 1 năm 2023
hạn như dân số toàn cầu ngày càng tăng, sự nóng lên toàn cầu và các mối nguy môi trường
do con người gây ra, cuối cùng có thể dẫn đến sự gia tăng nhu cầu về nguồn cung cấp thực
phẩm. Đây là lúc AI và ngành Agtech điều khiển bằng thị giác máy tính xuất hiện để giải
cứu bằng cách đẩy nhanh quá trình thu hoạch, kiểm soát chất lượng, chọn và đóng gói, phân
Bản quyền: © 2023 thuộc về tác giả.

Người được cấp phép MDPI, Basel, Thụy Sĩ.


loại, phân loại và các quy trình khác [6]. Khi nói đến trái cây, chúng rất dễ vỡ và thối
rữa nhanh chóng. Khoảng 30–35% trái cây thu hoạch bị lãng phí do việc xác định, phân loại
Bài viết này là một bài báo truy cập mở

phân phối theo các điều khoản và và phân loại trái cây không đúng cách và chậm trễ do công nhân không có kỹ năng đảm nhận.
điều kiện của Creative Commons Phân loại trái cây được coi là quy trình khó khăn và quan trọng nhất khi mua/bán trái
Giấy phép Ghi công (CC BY) (https:// cây. Người giao dịch bán/mua trái cây cần phải có kiến thức về (các) loại trái cây khác
creativecommons.org/licenses/by/ nhau để phục vụ mục đích đánh giá. Vì vậy, một người cần phải có kiến thức tốt để nhận
4.0/).
biết các loại trái cây khác nhau.

Tính bền vững 2023, ngày 15, 1906. https://doi.org/10.3390/su15031906 https://www.mdpi.com/journal/sustainability


Machine Translated by Google

Tính bền vững 2023, 15, 1906 2 trên 14

Nhiều phương pháp xác định, phân loại và phân loại trái cây, rau và hạt giống đã được
phát triển [7]. Đã có các phương pháp phân loại khác nhau được đề xuất cho các loại trái
cây khác nhau. Ví dụ, Altaheri et al. [8] đã đề xuất một mô hình thu hoạch bằng robot được
thiết kế để phân loại năm loại quả chà là khác nhau. Mô hình này đạt độ chính xác khoảng
99%. Mô hình này đã sử dụng bộ dữ liệu nội bộ để đào tạo và thử nghiệm. Bộ dữ liệu chứa
tổng thể 8000 hình ảnh. Trong một nghiên cứu khác, Shamim Hossain et al. [9] đã phát triển
một mô hình phân loại trái cây cho các ứng dụng công nghiệp. Họ đã sử dụng bộ dữ liệu có
sẵn công khai để đào tạo và thử nghiệm mô hình của mình. Một trong những bộ dữ liệu chứa
hình ảnh của các loại trái cây rất phức tạp để xác định. Mô hình đề xuất đạt độ chính xác
85%. Gulzar và cộng sự. [10] đã đề xuất một mô hình phân loại hạt giống dựa trên VGG16. Họ
đã sử dụng 13 loại hạt giống khác nhau và mô hình đạt được độ chính xác 99%. Mặt khác,
Hamid et al. [11] đã đề xuất một mô hình dựa trên cùng một bộ dữ liệu và sử dụng MobileNetV2 làm mô
Họ đã kết hợp một kỹ thuật học chuyển giao [12] và mô hình đạt được độ chính xác 99%.
Saranya và cộng sự. [13] đã thực hiện một nghiên cứu so sánh, trong đó họ đào tạo các mô hình
học máy và học sâu khác nhau trên một tập dữ liệu công khai. Bộ dữ liệu này chứa hình ảnh của
các loại trái cây khác nhau, chẳng hạn như táo, chuối, cam và lựu. Họ kết luận rằng các mô
hình dựa trên học sâu vượt trội hơn các mô hình học máy. Rojas-Aranda và cộng sự. [14] đã
phát triển một mô hình phân loại trái cây trong các cửa hàng bán lẻ bằng cách sử dụng học
sâu. Mục đích của nghiên cứu này là để cải thiện quy trình thanh toán tại các cửa hàng bán
lẻ. Mô hình cho thấy độ chính xác là 95% khi trái cây nằm trong túi nhựa, trong khi độ chính
xác được ghi nhận là 93% khi trái cây không được bao phủ bởi túi nhựa. Sridhar et al. [15] đã
đề xuất một mô hình cho 31 loại trái cây khác nhau bằng cách sử dụng phương pháp lai. Họ đã
kết hợp CNN và một bộ mã hóa tự động để xử lý dữ liệu khổng lồ này của 31 loại trái cây khác
nhau. Họ tuyên bố rằng mô hình của họ đạt được độ chính xác 99%. Châu và cộng sự. [16] đã
phát triển một mô hình để phát hiện độ đầy đặn của quả dâu tây. Họ đạt được độ chính xác
khoảng 86% khi phát hiện dâu tây trong nhà kính. Họ đã sử dụng dữ liệu RGD trong khi đào tạo
mô hình được đề xuất. Mamat et al. [17] đã đề xuất một mô hình dựa trên deep learning sử dụng
phiên bản Only Look Once (YOLO) và áp dụng transfer learning cho quả cọ dầu. Mô hình đạt độ
chính xác 98,7% đối với quả cọ dầu.
Một số nhà nghiên cứu tập trung vào việc xác định và phân loại bệnh trái cây [18].
Nghiên cứu này đã sử dụng kiến trúc VGG19 làm mô hình cơ sở. Họ tuyên bố rằng mô hình đề xuất của
họ đạt được độ chính xác khoảng 99% trong việc phân loại trái cây và bệnh tật của chúng. Trong một
nghiên cứu khác, Assuncao et al. [19] đã đề xuất một mô hình học sâu để hoạt động trên thiết bị di động.
Mô hình này nhằm phân loại quả đào dựa trên độ tươi cũng như xác định 3 loại bệnh hại trên
quả đào. Độ chính xác của mô hình được ghi nhận là 96%.
Họ đã kết hợp một số kỹ thuật tiền xử lý để cải thiện độ chính xác của mô hình được đề xuất.

Đã có một số nghiên cứu tập trung vào chất lượng của quả, chẳng hạn như [20–23].
Garillos-Manliguez et al. [20] đã đề xuất một mô hình ước tính độ chín của quả đu đủ. Điểm
độc đáo của mô hình này là nó được huấn luyện trên các hình ảnh siêu phổ và ánh sáng khả
kiến, không giống như các mô hình khác. Những hình ảnh này không chỉ thể hiện đặc điểm bên
ngoài mà còn cung cấp thông tin chi tiết về bên trong của trái cây. Mô hình đạt độ chính xác
97% về mặt ước tính độ chín của quả đu đủ. Hermann et al. [21] đã chọn quả cọ dầu để kiểm tra
độ chín của nó. Bộ dữ liệu họ sử dụng chứa khoảng bảy loại mức độ chín khác nhau của quả cọ
dầu. Họ đã đào tạo hai kiến trúc nổi tiếng (AlexNet và DenseNet) trên tập dữ liệu này và kết
luận rằng DenseNet vượt trội hơn AlexNet về độ chính xác 8%. Mahmood và cộng sự. [23] đã thực
hiện một nghiên cứu so sánh trên hai kiến trúc nổi tiếng (AlexNet và VGG16) để kiểm tra mức
độ trưởng thành của quả táo tàu. Bộ dữ liệu chứa ba loại hình ảnh khác nhau về độ chín (chưa
chín, chín và quá chín). Họ cũng sử dụng một số kỹ thuật tiền xử lý, chẳng hạn như tăng cường
dữ liệu. Họ tuyên bố rằng VGG16 vượt trội so với kiến trúc AlexNet khi đạt được độ chính xác
98%.
Machine Translated by Google

Tính bền vững 2023, 15, 1906 3 trên 14

Khi nói đến trái táo, táo là một loại trái cây thuộc họ Rosaceae có nguồn gốc từ châu Á. Nó
được trồng ở hơn 63 quốc gia trên thế giới, với Trung Quốc là nhà sản xuất chính. Do hàm lượng
nước cao, carbohydrate, axit hữu cơ, vitamin, khoáng chất và chất xơ, táo được coi là thực phẩm
bổ dưỡng nhất. Quả táo, loại trái cây được trồng và tiêu thụ rộng rãi thứ tư trên hành tinh, có
thể được chia thành nhiều loại tùy thuộc vào đặc điểm chất lượng của nó [24]. Có khoảng 7500
giống táo khác nhau được tìm thấy trên thế giới [25]. Các giống táo khác nhau có những lợi ích
khác nhau đối với sức khỏe. Đối với một người bình thường, không dễ để nhận biết các loại táo và
các loại trái cây khác với nhiều chủng loại. Do đó, cần có một cách tiếp cận/mô hình dựa trên học
sâu, có thể nhận dạng các loại trái cây khác nhau, giải quyết vấn đề phụ thuộc vào chuyên gia và
nâng cao hiệu quả, độ chính xác trong việc nhận dạng và phân loại các loại trái cây.

Trong nghiên cứu này, một phương pháp học sâu đã được đề xuất để phân loại và nhận dạng các
loại trái cây khác nhau. Mô hình đề xuất kết hợp kỹ thuật học chuyển giao, giúp giải quyết các
vấn đề liên quan đến vấn đề thiếu dữ liệu huấn luyện.
Kỹ thuật này khuyến khích ý tưởng không đào tạo mô hình từ đầu và giúp giảm đáng kể thời gian đào
tạo. Trong nghiên cứu này, một mô hình học sâu nổi tiếng, Mo mậtNetV2 [26], được sử dụng làm mô
hình cơ sở nhưng đã được sửa đổi bằng cách thêm năm lớp khác nhau để cải thiện độ chính xác và
giảm tỷ lệ lỗi trong quá trình phân loại . Mô hình đề xuất được đào tạo trên tập dữ liệu gồm 40
loại trái cây. Kết quả cho thấy mô hình đề xuất đạt tỷ lệ chính xác cao nhất trong việc xác định
các loại trái cây khác nhau. Mô hình đề xuất có thể được triển khai trong một ứng dụng di động
để sử dụng thực tế. Thông tin chi tiết về nó được đề cập trong Phần 2.

Các điểm sau đây tóm tắt những đóng góp của bài viết này:
• Một đánh giá chi tiết đã được thực hiện để kiểm tra công việc đáng chú ý nhất trong phân loại trái cây

thông qua học máy và học sâu.


• Một vấn đề phân loại trái cây đã được giới thiệu lại dựa trên mô hình MobileNetV2 CNN được đào
tạo trước , trong đó các loại trái cây khác nhau được phân loại. •

Một mô hình đã sửa đổi đã được đề xuất bằng cách sử dụng các kỹ thuật học sâu nâng cao để phân
loại trái cây và các kỹ thuật điều chỉnh mô hình khác nhau đã được sử dụng để giảm khả năng
khớp quá mức của mô hình, chẳng hạn như kỹ thuật bỏ học và tăng cường dữ liệu.
• Một kỹ thuật tối ưu hóa đã được phát triển để theo dõi bất kỳ thay đổi tích cực nào về độ chính
xác của xác thực và tỷ lệ lỗi xác thực. Trong trường hợp thay đổi, một bản sao lưu của mô
hình tối ưu đã được thực hiện để đảm bảo rằng mô hình được đề xuất cho thấy độ chính xác
tối ưu và ít mất kiểm chứng nhất.

Phần còn lại của bài viết này được tổ chức như sau: Trong Phần 2, mô tả về tập dữ liệu, lựa
chọn mô hình, mô hình được đề xuất, điều chỉnh mô hình và cài đặt thử nghiệm được báo cáo và thảo
luận. Trong Phần 3, các kết quả và thảo luận được cung cấp, trong khi Phần 4 mô tả kết luận.

2. Vật liệu và phương pháp


2.1. tập dữ liệu

Trong công trình nghiên cứu này, một bộ dữ liệu công khai [27] đã được sử dụng, chứa hình
ảnh của 40 loại trái cây khác nhau, chẳng hạn như Braeburn, Crimson Snow, Golden 1, Golden 2,
Golden 3, Granny Smith, Pink Lady, Red 1, Red 2 , Đỏ 3, Đỏ Ngon, Đỏ vàng 1, Đỏ vàng 2, Mơ, Bơ,
Chuối, Chuối Lady Finger, Chuối đỏ, Củ dền, Việt quất, Quả xương rồng, Dưa vàng 1, Dưa đỏ 2, Khế,
Cherry, Cherry sáp đen, Cherry Đỏ sáp, Vàng sáp anh đào, Hạt dẻ, Quýt Clementine, Cocos, Nho
xanh, Nho trắng, Bưởi hồng, Bưởi trắng, Ổi, Huckleberry, Kaki, Kiwi và Kumquats. Tập dữ liệu được
chia thành hai tập con tập dữ liệu huấn luyện và thử nghiệm. Số lượng hình ảnh ban đầu cho mỗi
loại trái cây được thể hiện trong Bảng 1.
Machine Translated by Google
Tính bền vững 2023, 15, x CHO NGƯỜI ĐÁNH GIÁ 4 trên 15

Tính bền vững 2023, 15, 1906 4 trên 14

Các loại Số hình ảnh 640 Các loại trái cây Số hình ảnh 654

trái cây Apple quả xương rồng

604 658
các Braeburn
loại tráiApple Crimson
cây khác nhauSnow Cantaloupe
và số 1 Bảng
lượng hình 1. Chi
ảnh của tiết về
chúng.
Táo vàng 1 Dưa đỏ 2 Loại trái 644
cây Loại trái cây Táo vàng 2 656
Khế Táo Braeburn Quả xương
Số ảnhrồng
653 Táo vàng 3 Táo đỏ thẫm
640 Số ảnh
654 738
Táo bà Smith Táo vàng 1 Táo hồng quý bà Táo vàng 2 Táo
vàng
Táo
Đỏ 1Đỏ
3Táo
3
TáoTáo
ĐỏđỏNgon
1 Táo bà ngoại 645
Smith Táo đỏ 2 Táo bàquảhồng
anh đào
656
Táo Đỏ 2 Táo Đỏ 3 dưa đỏ 1
Táo Đỏ Vàng 1 Táo Đỏ 604 Anh Đào Sáp Đen 658
Vàng
Ngon2 Táo Đỏ Vàng 1 dưa đỏ 2
Mơ Táo Đỏ Vàng 2 646
644 620 653 Anh Quả
Đàokhế
Sáp Đỏ 656
656 645 738
Mơ Bơ Bơ Chuối 645 658656
656 vàngsáp
quả anh
Màu đào
quả anh đào

Chuối Lady Finger 646 Sáp Anh Đào Hạt Dẻ Đen 656
Finger
Banana
ChuốiLady
Đỏ 636 616
Chuối Đỏ Củ dền 620 Anh Đào Sáp Đỏ 645
Củ dền Việt 595 Clementine 818
quất
quất Việt 656 Anh Đào Sáp Vàng 658
654
636 dừa hạt dẻ 654616

595
711 Clementine
Màu xanh da trời
656818
Quả nho
654 dừa 654
836 nho trắng 658
711 màu xanh nho 656
635
836 Bưởi hồng Nho trắng 656658

635
593 Bưởi Hồng Bưởi Trắng 658656
593 Bưởi Ổi trắng 658
642 656
642 Trái ổi 656
616 quả lý gai 656
616 quả lý gai 656
640
640 kaki kaki 654654

604
604 Kiwi Kiwi 622622
626 quất 628
626 quất 628

Các loại trái cây được trồng trong một trục động cơ quay (3 vòng/phút) và một video
ngắn 20 giây là Các loại trái cây được trồng trong một trục động cơ quay (3 vòng /
phút) và một video ngắn 20 giây được thực hiện cho mỗi lớp. Những hình ảnh được lấy từ video
đó. Nền của các hình ảnh được chụp cho mỗi lớp. Những hình ảnh được lấy từ video đó. Nền
của ảnh đã được xóa bằng một thuật toán do điều kiện ánh sáng thay đổi. Các hình ảnh trong
Hình 1 đã bị xóa bằng một thuật toán do các điều kiện ánh sáng khác nhau. hiển thị hình
ảnh chụp mẫu của trái cây.
Hình 1 cho thấy các hình ảnh trái cây được chụp mẫu.

Hình 1. Ảnh mẫu của 40 loại trái cây.


Hình 1. Ảnh mẫu của 40 loại trái cây.
Machine Translated by Google

Tính bền vững 2023, 15, x CHO NGƯỜI ĐÁNH GIÁ 5 trên 15

Tính bền vững 2023, 15, 1906 5 trên 14

2.2. Lựa chọn người mẫu

2.2. LựaTrong
hình
chọn lĩnh
tiềm vực nomic
mô năng xử lý vàhìnhtỷảnh, CNN được
lệ chính chú ýCó
xác cao. nhiều
nhữnghơn nhờtrúc
kiến hệ sinh tháitiếng,
CNN nổi khổng trong
lồ
đó Trong lĩnh vực xử lý ảnh, CNN được chú ý nhiều hơn do nó rất lớn, rất phổ biến trong
lĩnh vực xử lý và phân loại ảnh, chẳng hạn như AlexNet [28], tiềm năng kinh tế và tỷ
lệ chính xác cao. . Có các kiến trúc CNN nổi tiếng, đó là VGG16 [29], InceptionV3 [30],
ResNet [31] và MobileNetV2 [26]. Trong bất kỳ thị giác máy tính nào đều rất phổ biến trong
lĩnh vực xử lý và phân loại hình ảnh, chẳng hạn như AlexNet [28], nhiệm vụ, đó là (các)
hoạt động tích chập có đóng góp cao. Tuy nhiên, do VGG16 [29], InceptionV3 [30], ResNet
[31] và MobileNetV2 [26]. Trong bất kỳ tầm nhìn máy tính nào đối với các cấu trúc mạng lớn
và sâu, thời gian xử lý, cũng như chi phí, tăng trong nhiệm vụ, thì (các) hoạt động tích
chập có đóng góp cao. Tuy nhiên, do hầu hết các mạng này, chẳng hạn như AlexNet, VGG16,
InceptionV3, ResNet, v.v. Tuy nhiên, cấu trúc mạng lớn và sâu, thời gian xử lý cũng như
chi phí, tăng nhiều nhất khi nói đến MobileNetV2, phần dư nghịch đảo của nó cấu trúc nút
cổ chai tuyến tính và cấu trúc của các mạng này, chẳng hạn như AlexNet, VGG16, InceptionV3,
ResNet, v.v. Tuy nhiên, khi nó thực sự giúp giảm tính toán tích chập. Kiến trúc của nó
được ưu tiên hơn các kiến trúc khác khi đến với MobileNetV2, cấu trúc dư nghịch đảo và cấu
trúc cổ chai tuyến tính của nó giúp ích do kiến trúc đơn giản và các đặc điểm hiệu quả về
bộtrình
InceptionV3,
đào
các
nhớ.
tạo
kiến
bày
về
Bảng
trúc
thu
độResNet
2 chính
hồi
trình
kháctập

xác,
do
bàyMo,
dữ
độphép
mậtNetV2.
liệu
chính
kiếntính
trái
trúc
xác,tích
Điều
cây
đơn
khảvà
chập
quan
giản
năng
điểm
rút
trọng

thuF1
các
gọn.
hồi
của
cần
đặc
Kiến

AlexNet,
lưu
điểm
điểm
trúc
ý là
hiệu
F1VGG16,
của
tất
của
quả

cả
AlexNet,
về
InceptionV3,
được
cácbộmô
ưa
nhớ.
VGG16,
hình
thích
Bảng
đã
ResNet
hơn
được
2
và MobileNetV2. Nó không sử dụng bất kỳ kỹ thuật tiền xử lý nào. Chỉ có lớp phân loại được
sửa
trên.
trái
đổiđổi,
dựa
Như
câyđiều
trên
đã
mà đề
không
quan
sốcập
mậtNetV2
trọng
sử
trước
dụng
cần
đây,

bất
lưu
bộcác
kỳ
nhớ
ý lớp
làhiệu
kỹ tất
thuật
nàoquả
cả
dựatiền
các

trên
được

xử số
hình
lýthiết
lượng
Mo.
đãChỉ
kế
được
lớp
chủ
cócó
đào
lớp
yếu
trong
tạo
phân
chotrên
tập
các
loại
dữ
tập
ứng
được
liệu
dữ
dụng
sửa
liệu
nói
di
động. Do các lớp có trong tập dữ liệu nói trên. Như đã đề cập trước đây, MobileNetV2 là
bộvànhớ
chínhđược
xác.
này,
thiết
bảng
có thể
kế
rằng
chủ
thấy
nóyếu
quacho
vượt bảng
trội
cácrằng
hơn
ứng tất

dụngvượt
cảdicác
trội
động.
môhơn
hình
Do tất
đó,
khác
cả
nó về
các
có độ
thể
môchính
hình
được xác.
khác
nhìn về
thấy
hiệu
từ quả
độ

Bảng 2. Độ chính xác, thu hồi và điểm F1 của các mô hình khác nhau khi được đào tạo trên bộ dữ liệu trái cây.
Bảng 2. Độ chính xác, thu hồi và điểm F1 của các mô hình khác nhau khi được đào tạo trên bộ dữ liệu trái cây.

người mẫu Độ chính xác Nhớ lại Điểm F1


người mẫu Độ chính xác Nhớ lại Điểm F1
AlexNet 0,81 0,79 0,83
AlexNet 0,81 0,79 0,83
VGG16 0,79 0,80 0,80
VGG16 0,79 0,80 0,80
InceptionV3 0,84
0,84 0,82
0,82 0,81
0,81
InceptionV3
ResNet ResNet 0,82 0,82 0,81 0,81 0,82
0,82
MobileNetV2 0,89 0,91 0,89
MobileNetV2 0,89 0,91 0,89

Hình 2 cho thấy độ chính xác của các mô hình khác nhau đạt được khi đào tạo về trái
bộchính
mậtNetV2
lượt
cây
dữdữliệu

Hình
liệu
xác
5,
đạt
Mo211
trái
cao
cho
chứa
độ
vànhất
cây
chính
thấy
7%.
bốnchứa
với
tionV3,
độ
mươi
xác89%,
chính
bốn
cao
loại
mươi
VGG16
cao
nhất
xác
trái
hơn
loại
của

với
cây
ResNet,
AlexNet
các
trái
89%,
khác
môcao
cây
hình
Incep
nhau.
lần
khác
hơn
lượt
khác
tionV3,
Từ
ResNet,
nhau.
hình

nhau
7,
Từ
VGG16
vẽ,
Incep
đạt
5,
hình

11
được
vàmậtNetV2
thể

này,
AlexNet
khi
7%.
thấy
rõđào
ràng
đạt

7,tạo
rằng
độ
lần
làtrên
bộ
Mo

Hình 2. Tỷ lệ chính xác của các mô hình khác nhau trong quá trình lựa chọn mô hình.
Hình 2. Tỷ lệ chính xác của các mô hình khác nhau trong quá trình lựa chọn mô hình.

TL-MobileNetV2
2.3.
2.3. TL-MobileNetV2

Tiểu mục này tập trung vào mô hình đề xuất dựa trên phân loại trái cây da Tiểu mục này tập trung vào mô hình đề xuất dựa trên bộ dữ liệu

phân loại trái cây. taset. Mô hình được đề xuất, TL-MobileNetV2, dựa trên kiến trúc MobileNetV2 [26]. Mô hình được đề xuất, TL-MobileNetV2, dựa

trên kiến trúc MobileNetV2 [26]. Kiến trúc nói trên chủ yếu được phát triển cho môi trường di động và tài nguyên hạn chế. Kiến trúc nói trên chủ

yếu được phát triển cho thiết bị di động và hạn chế về tài nguyên. Mục đích chính của việc áp dụng loại kiến trúc này nằm ở sức mạnh của nó về mặt
, ,
Machine Translated by Google số nút trong lớp phân loại. Để cải thiện độ chính xác, một tùy chỉnh chứa năm
lớp khác nhau đã được gắn vào mô hình cơ sở của MobileNetV2 bằng cách tái tạo
lớp phân loại.
Phần đầu tùy chỉnh chứa (i) lớp tổng hợp trung bình, (ii) lớp làm phẳng,
Tính bền vững 2023, 15, 1906 (iii) lớp d, (iv) lớp bỏ học và (v) lớp softmax, như trong Hình 3. Điều
6 trên 14 quan
trọng cần đề cập là kích thước của lớp tổng hợp trung bình được đặt thành (7
× 7). Trong lớp phẳng, các nơ-ron dẹt được đưa vào một lớp dày đặc với chức
năng kích hoạt là ReLU. đã được tiến hành bằng cách đặt xác suất của lớp bỏ
học với giá trị 0,5, giảm mức sử dụng bộ nhớ, chi phí tính toán và tuân thủ thiết kế
của nó để bổ sung bốn mươi nút trong lớp phân loại của mô hình. Thực hiện
tất cả t tập trung hơn vào các ứng dụng di động. Điều quan trọng cần lưu ý là những
thay đổi kiến trúc nói trên đã tạo ra một phiên bản cải tiến của kiến trúc
MobileNetV2 ban đầu có khoảng một nghìn nút trong lớp phân loại của nó. Tuy nhiên,
để phân biệt các nút trong lớp (phân loại) cuối cùng của nó; đây là một mod
tối ưu và phù hợp làm cho nó phù hợp với vấn đề đã nói, điều quan trọng là phải khắc
được giải quyết trong
phục sốtáclượng
phẩm nút
này.trong
lớp phân
vấn đềloại.
đã nói
Để cải thiện độ chính xác, một đầu
tùy chỉnh, chứa năm loại khác nhau. Từ tài liệu, rõ ràng là học chuyển giao [32] đã
cáchtrung
hợp thay bình,
thế lớp
(ii)
phân
cải
Do
đến
lớp
loại.
đó,
thiện
việc
phẳng,
sựlực
không
các
phụ
(iii)
của
lớp
thuộc
cóngười
mật
pe
đủvào
được
lớp
độ
học
khối
dữ
dữ
gắn
mục
liệu
liệu,
lượng
vào
tiêu
đãmô
(iv
lớn
trên
giảm
hình
)Đầu
lớp
các
vàcơ
tùy
các
bỏ
lĩnh
sởchỉnh
học
vấn
của
vực

đề
MobileNetV2
chứa
mục
(v)
liên
tiêu.
(i)
lớp
quan
lớp
softmax,
bằng
tổng
như trong Hình 3. Điều quan trọng là giảm [33,34]. Có nhiều cách khác nhau để tích
trung bình được đặt
hợphình
mô thành
học hoàn
chuyển
(7 ×
toàn
7).
đổidựa
Trong
trong
trênlớp
bài
tậpphẳng,
họcdữsâu
liệu
các
đềmới.

cậphình;
rằng một
kíchcách
thướclà của
đào lớp
tạo tổng hợp

Một cách khác là các tế bào thần kinh dẹt được đưa vào một lớp dày đặc với
chức năng kích hoạt
thêmlà ReLU.
vào Quá trình
mô hình này trong
hiện có, chỉ đào
khitạo
đó các
đượclớp
tiếncủa mô hình
hành bằng đã được
cách đặt xác suất
của lớp bỏ học với giá trị 0,5 và các lớp hiện có bị đóng băng. Trong công trình
nghiên cứu này, một phương pháp kết hợp đã được chọn, trong đó bổ sung bốn
mươi nút trong lớp
đàophân
tạo loại của mô
mô hình, chỉhình.
nhữngThực
lớp hiện tất cả
mới được những
thêm vào điều này khi
mới được đào bắt
tạo.đầu
Sau lần
lặp thứ 20 , các loại)
lớp hiện
cuốicó không
cùng củabị
nó;đóng
đâybăng và một
là một số nút
mô hình tốikhác trong
ưu và phù lớp
hợp (phân
cho việc điều
chỉnh trọng số đã
đềđược
nói thực
trên hiện
được cho
giảicác lớptrong
quyết được đào
côngtạo của
việc mô hình
này. dựa
tập dữ trên vấn
liệu.

Hình 3. Mô hình TL-MobileNetV2.


Hình 3. Mô hình TL-MobileNetV2.

2.4. Điều chỉnh


mô hình
mục tiêuTừ
trên
các
củacác
tài
người
lĩnh
liệu,
học
vực
rõmục
ràng
tiêu.
là học
Kếtchuyển
quả là,
giao
sự phụ
[32]thuộc
đã cải
vào
thiện
một khối
hiệu lượng
suất
lớn dữ liệu đã giảm và các vấn đề liên quan đến việc không có đủ dữ liệu đã giảm
[33,34]. Có nhiều cách khác nhau để tích hợp học chuyển giao trong các mô hình học
sâu; một cách là đào tạo mô hình hoàn toàn dựa trên tập dữ liệu mới. Một cách khác
là chỉ đào tạo các lớp của mô hình đã được thêm vào mô hình hiện có, trong khi các
lớp hiện có bị đóng băng. Trong công trình nghiên cứu này, một phương pháp kết hợp
đã được chọn, trong đó khi bắt đầu đào tạo mô hình, chỉ các lớp mới được thêm vào mới
được đào tạo dựa trên bộ dữ liệu trái cây. Sau lần lặp lại thứ 20, các lớp hiện có
không bị đóng băng và một sự điều chỉnh trọng số nhẹ đã được thực hiện đối với các
lớp được đào tạo của mô hình dựa trên tập dữ liệu nói trên.

2.4. Điều chỉnh

mô hình Trong công việc này, chúng tôi đã kết hợp các kỹ thuật tiền xử lý/điều chỉnh mô
hình khác nhau để ngăn mô hình khỏi khớp quá mức. Sau đây là những kỹ thuật được giải thích

ngắn gọn: • Tăng cường dữ liệu: một trong những cách tốt nhất để khắc phục vấn đề không đủ
dữ liệu là sử dụng kỹ thuật tăng cường dữ liệu. Kỹ thuật này giúp tạo ra các hình ảnh
nhân tạo ngẫu nhiên từ dữ liệu nguồn bằng các phương pháp khác nhau, chẳng hạn như shift, shears,
Machine Translated by Google là sử dụng kỹ thuật tăng cường dữ liệu. Kỹ thuật này giúp tạo các hình ảnh
nhân tạo được chạy từ dữ liệu nguồn bằng các phương pháp khác nhau, chẳng
hạn như dịch chuyển, xoay ngẫu nhiên và lật. Trong công việc này, một chức

Tính bền vững 2023, 15, 1906


năng tích hợp trong thư viện Keras đã được sử dụng để tạo mười hình
7 trênảnh
14 từ
mỗi hình ảnh bằng cách thu phóng ngẫu nhiên 20%, điều
chỉnh chiều cao 10%, thay đổi chiều rộng 10% và xoay 30%. • Tốc độ học tập thích
ứng: kỹ thuật này giúp đẩy nhanh quá trình đào tạo và giảm bớt áp lực trong
việc lựa quay
đầu tôi chọn ngẫu
tốc độ học và
nhiên tậplật.
và lịch
Trongtrình. Trongnày,
công việc côngmột
việc này,
chức bantích hợp
năng
trong thư viện Keras [35] đã được sử dụng để tạo
mười ảnh từ mỗi ảnh bằng cách thu phóng ngẫu nhiên 20%, tốc độ điều chỉnh
được đặt thành INIT_LR = 0,001 và sau đó giảm chiều cao của biểu mẫu xuống dec
dụng.
kiểm
chính
10%,
tất
biểu.
tra
• cả
xác.
Tốc
dịch
được
Trong

Các
độ
Điểm
chuyển
thiết
học
trọng
công
kiểm
thích
lập
chiều
việc
sốtra
của
đểứng:
này,
rộng

giám
môhình:
kỹ
bao
hình
10%
sát
thuật
giờ

trong
được
áp xoay
cũng
này
lựclưu
khi
giúp
của
30%.

với
đào
việc
sự
tăng
INIT_LT/EPOCHS
tốc
tạo
thay
chọn
độ
tốc
môđổi
học
hình,
quá
tốctích
ban
trình
độmột
đã
đầu
học
cực
được
điểm
đào
được
tập
về tạo
độ
sử

đặt

lịch
thành INIT_LR = 0,001 và sau đó phân rã biểu mẫu bao giờ độ chính xác là tối
ưu. Trong công trình nghiên cứu này, một điểm kiểm tra mô hình của sự phân
rã = huấn
INIT_LT/EPOCHS đã được
luyện mô hình, một sử dụng.
điểm kiểm• tra
Điểmđược
kiểmđặt
trađểmôgiám
hình:sáttrong khi kiểm “
khi điểm
tra = Điểm
cứ khi nào kiểm trakỳmôthay
có bất hìnhđổi
(fname, monitor
tích cực = “val_loss”,
nào về độ chính xác. mode = bất
Trọng số của mô
hình được lưu khi save_best_only = True, dài dòng = 1) đã được sử
ưu.
dụng.
mất Trong
mátCuộc
của
công
gọi
mô trình
lại này
hình và
nghiên
theo
chỉ ghi
cứu
dõiđènày,
giálên
trị
một
môhợp
điểm
hình
lệkiểm
đã
baohuấn
tra
giờluyện

độ hình
chính
khivềcó
xác
sựmột
là điểm
tối
kiểm tra dạng decrea = Model Checkpoint(fname, monitor=“val_loss”,
mode=“min”, sự mất mát so với mô hình tốt
nhất
thực
lên

Cuộc
mất
cácngụ


nơ-ron
trước
•gọi
Bỏ
hình
ý
hình
rằng
lại
học:
đó.
được
được
trong
này

save_best_only
Kỹchọn
đào
hình
giám
thuật
thờitạo

đóng
sát
gian
bỏ
loại
khi
quá
học
góp


bỏ
=trình
giúp
thua
chỉ
True,
sự
ngẫusụt
ghi
tránh
lỗ
xác
nhiên.
verbose
giảm
so
đè vấn
với
trong
=
đề
mô1)trang
hình
quá
đã được
trình
tốt
bị nhất
quá
sử
đàodụng.
mức
trước
tạo,

đó. • Bỏ học: Kỹ thuật bỏ học giúp tránh vấn đề trang bị quá mức và trong thời
gian này, các nơ-ron tạm thời bị bỏ qua để kích hoạt các nơ-ron xuôi dòng,
đào tạo, các bất
góp của nơ-ron được đổi
kỳ thay chọntrọng
và loại bỏ ngẫu
số nào khôngnhiên. Nó ngụ
được thực ý rằng
hiện trên sự
bấtđóng
kỳ nơ-ron
nào
đổi trên
bỏ qua
nào trọng
trên đường
đốiđường
lượng chuyền
với chuyền
việc ngược.
nào không
kích
ngược.
hoạtcủa
được cáccác tế
thựctếhiệnbào thần
bào trên
thần bấtkinh này
kinhkỳxuôi
tế bàotạm thời
dòngthần
và bấtbị
kinhkỳ thay

2.5. Cài đặt môi trường thí nghiệm và chỉ số đánh giá mô hình
2.5. Nghiên
Môi trường thí nhằm
cứu này nghiệm
đề và chỉmột
xuất số mô
đánh giátối
hình mô ưu
hình
để nhận dạng và phân loại
Nghiên
loại 3.0
Pythoncác
3.0 cứu
trên
loại
trên này
các
trái
HĐH nhằm
loại
cây đề
Windows
trái xuất
khác cây. một
nhau.
10, HĐH
MôMô mô
hình
dowshình
hìnhđề
10,
đề tối
xuất
xuấtưu để
với được
cấu
được nhận
hình
triển dạng
triển
hệ
khai và
khai
thống phân
bằng
bằng
sử dụng
Python
bộ
xử lý i7 và RAM 16 GB. với cấu hình hệ thống sử dụng bộ vi xử lý i7 và RAM
16 GB.
Hiệu suất của mô hình được đo lường bằng cách sử dụng nhiều loại ma trận Hiệu suất của mô hình
được đo lường bằng cách sử dụng nhiều loại ma trận bắt nguồn từ ma trận nhầm lẫn 2 × 2,
như trong Hình 4. từ ma trận nhầm lẫn 2 × 2, như trong Hình 4.

Hình 4. Ma trận nhầm lẫn (Ci, j). Hình 4. Ma trận nhầm lẫn (Ci, j ).

Khi kết hợp các kỹ thuật học máy, điều quan trọng là phải đánh giá mô
kiểm
ma
hình
dụng
đề trận,
xuất:
tra
Khiđánh
để hiệu
như
kết
• Độsau,
giá
hợp
suất
chính

các

của
hình
xác

kỹnó.
hình
thuật
=nhằm
•VìĐộ
đề

kiểm
học
chính
xuất
domáy,
tra
đó,
của
xáchiệu
điều
các
chúng
= •ma
suất
quan
tôi:
trận,
của
trọng
đánh
như
nó.
làgiá
sau,

phải


được
do
đánh
hình
đó,
sửgiá
các
để

TP+TN
2TP+FP+TN+FNa
=TP. +
TP+FP
2 + + +

• Nhớ lại = TP.
TP+FN
=
đó TP, TN, FP và +
• Trong
• = FN lần lượt là dương thực, âm thực, dương giả và âm tính giả •

+ Hàm
Trung bình vĩ mô:
tính toán F-1 cho mỗi nhãn và trả về giá trị trung bình mà không xem xét tỷ lệ cho từng nhãn
trong tập dữ liệu. • Trung bình có trọng số: Hàm tính toán F-1 cho
mỗi nhãn và trả về giá trị trung bình có xét đến tỷ lệ cho từng nhãn trong tập dữ liệu.
Machine Translated by Google hiệu suất khi nói đến độ chính xác xác thực và mất mát.

3. Kết quả

Tính bền vững 2023, 15, 1906 Phần này trình bày hiệu suất của mô hình đề xuất về độ chính xác đào tạo, mất đào tạo, cũng như độ
8 trên 14

chính xác xác nhận, như trong Hình 5. Mô hình đề xuất được đào tạo trong 100 lần lặp lại. Từ hình vẽ, có thể

nhận thấy rằng độ chính xác đào tạo của mô hình được đề xuất bắt đầu với 44% từ lần lặp đầu tiên và độ chính

xác của mô hình được đào tạo được đánh giá thêm bằng cách sử dụng độ chính xác và độ mất kiểm chứng. Hơn

nữa, tăng lên đáng kể. Độ chính xác đạt 90% trong 10 lần lặp đầu tiên. Tại t, giám sát liên tục được sử dụng
đểvàphát
xác hiện
thực bất
khi kỳ
nóisai
đếnlệch đáng chú
độ chính xác ývànào
mấttrong hiệuxác
mát của suất đào Lần
thực. tạo lặp thứ 30, mô hình đạt độ chính xác tối

đa (100%). Từ lần lặp lại thứ 30 của các phường, có thể suy ra rằng tỷ lệ chính xác của mô hình được đề xuất
3. Kết quả
vẫn ở mức tối đa t cho đến khi kết thúc khóa đào tạo.
Phần này trình bày hiệu suất của mô hình đề xuất về đào tạo. Hình 5 cũng cho thấy tổn thất
đào tạo của mô hình đề xuất. Từ hình này, độ chính xác, tổn thất đào tạo, cũng như độ chính xác
xác thực, như trong Hình 5. Đề xuất mô tả rằng khi bắt đầu giai đoạn đào tạo, tổn thất đào tạo
cao do mô hình mod được đào tạo trong 100 lần lặp. Từ hình này, có thể nhận thấy rằng việc đào tạo chưa
được
thất
đượcđào
tiếp
đề tạo
xuất
xúcsẽ
với
bắt
giảm.
dữ
đầuliệu.

vớicó44%
Tuy
thểtừ
nhiên,
được
lần chú
lặp
dầnýđầu
dần
tăng
tiên
môlên
hình
vàđáng
độ
đọcchính
kể.
hình
Độxác
ảnh
chính
bắt
vớixác
đầu
độ đạt
chính
ghi 90%
nhớ
xác
trong
chúng,
của 10
môvàlần
hình
cuối cùng tổn
lặp
tính,
chínhđầu tiên.
môxác
hình Ở
môlần
củađạt độ thứ
hình 30xác
chính
được ,
đềtổn
tối
xuấtthất
đavẫn đào tạoTừ
(100%).
ở mức đạt
tối 0,6
lần
đa trong
lặp
theothứ 20
mỗi30 lần
lần
trở lặpĐến
lặp.
đi, đầuthể
có tiên
lần vàra
suy
lặp giảm
thứ sốtỷlần
rằng
100, lệ lặp
tổn thấtkịch
đào
tạo đã đạt tới 0,3 và tiếp tục cho đến khi kết thúc quá trình đào tạo. các đặc điểm của một mô hình tốt.

Hình 5. Độ chính
MobileNetV2. xác5.vàĐộmất
Hình mát xác
chính trong
và quá
mất trình đàođào
mát khi tạotạo
và về
xácmặt
thực
đàocủa
tạomôvàhình
xác TL-
nhận mod TL-Mobile

Hình 5 cũng
Tuy nhiên, họ đãcho thấy
mô tả tổn
rằng khithất đàogiai
bắt đầu tạođoạn
củađàomô tạo,
hìnhtổnđềthất
xuất.
đào Từ
tạo con số mô
cao do này,
hình
nhìn chung,
hoạt động hầu hết
tốt trong giaicác
đoạnngười mẫu Điều
xác nhận. đều này
thểlàhiện tốttếtrong
do thực là mô quá
hình trình
đã bật đào
chưa tạo.
được tiếp
xúc với dữ liệu. Tuy nhiên, dần dần mô hình đọc các hình ảnh và được đào tạo về dữ liệu được giám
sát. Để tìm ra hiệu suất của nó, điều quan trọng là bắt đầu ghi nhớ chúng, và cuối cùng thì tổn thất đào
tạo sẽ giảm xuống. Nó có thể được nhận thấy xác nhận hiệu suất của mô hình. Với mục đích này, mô
hình đề xuất là va rằng tổn thất đào tạo đạt 0,6 trong 20 lần lặp đầu tiên và cũng được giảm đáng kể
theo

lần
hình
ngày.
lặp.tốt.
Đến
Hìnhlần
5 cho
lặp thấy
thứ 100,
độ chính
tổn thất
xác xác
đào nhận
tạo đã
và đạt
mất tới
mát 0,3,
của mô
điều
hình
nàyđược
cho đề
thấy
xuất.
các bởi
đặc mỗi
điểm của một

Nói chung, hầu hết các mô hình hoạt động tốt trong quá trình đào tạo. Tuy nhiên, chúng không hoạt động

tốt trong giai đoạn xác nhận. Điều này là do mô hình chỉ được đào tạo trên dữ liệu được giám sát. Để tìm ra

hiệu suất của nó, điều quan trọng là phải xác nhận hiệu suất của mô hình. Với mục đích này, mô hình đề xuất

cũng đã được xác nhận. Hình 5 cho thấy độ chính xác xác nhận và mất mát của mô hình được đề xuất.

Nó mô tả rằng mô hình bắt đầu với 15% độ chính xác khi bắt đầu quá trình và trong
vòng 10 lần lặp lại, mô hình đạt 100%. Từ lần lặp thứ 5 trở đi, độ chính xác xác thực
của mô hình vẫn ổn định. Khi đề cập đến việc mất xác thực của mô hình được đề xuất,
có thể thấy từ hình vẽ rằng mô hình bắt đầu với mức mất xác thực rất cao,
Machine Translated by Google

Tính bền vững 2023, 15, 1906 9 trên 14

đó là phổ biến trong tất cả các mô hình học sâu. Mất xác thực của mô hình được đề
xuất giảm đáng kể và đạt 0,5 trong 10 lần lặp đầu tiên. Từ lần lặp thứ 10 trở đi cho
đến lần lặp thứ 50, tổn thất xác thực không đổi và sau đó bắt đầu giảm trở lại từ lần
lặp thứ 55. Cuối cùng, nó đạt 0,35 ở cuối lần lặp thứ 100.
Trong quá trình đào tạo và xác nhận, mô hình cho thấy sự ổn định trong hiệu suất của
nó. Mô hình được đề xuất cho thấy tỷ lệ chính xác rất cao trong quá trình đào tạo và nó
cũng phản ánh như vậy trong quá trình xác nhận. Khi nói đến tổn thất đào tạo và mất xác
thực, mô hình chứng minh rằng nó không quá khớp. Điều này là do các kỹ thuật tiền xử lý
được sử dụng trong mô hình đề xuất đã giúp mô hình đạt được kết quả tốt hơn mà không bị quá khớp.
Hơn nữa, kỹ thuật tăng cường dữ liệu được kết hợp trong mô hình đề xuất đóng một vai trò
quan trọng trong việc hiển thị mô hình với các biến thể khác nhau của hình ảnh. Ngoài ra,
việc sử dụng kỹ thuật bỏ học đã giúp hiệu suất xác thực của mô hình bằng cách đảm bảo
rằng mô hình không sai lệch nhiều so với hiệu suất đào tạo của nó.
Bảng 3 cho thấy hiệu suất của mẫu TL-MobileNetV2 dựa trên từng loại trái cây về độ
chính xác, thu hồi, điểm F1 và hỗ trợ. Các hỗ trợ hiển thị số lượng hình ảnh được sử dụng
để đào tạo và xác thực mô hình sau khi áp dụng kỹ thuật tăng cường dữ liệu. Như đã đề cập
trước đó, đối với mỗi phiên bản của hình ảnh, kỹ thuật tăng cường hình ảnh tạo ra mười
phiên bản khác nhau của hình ảnh đó, được sử dụng để đào tạo mô hình.
Có thể suy ra từ bảng rằng mô hình đạt được giá trị tối đa cho mỗi loại khi nói đến độ

chính xác, khả năng thu hồi và điểm F1 ngoại trừ một số loại trái cây, chẳng hạn như Táo
vàng 1, Táo đỏ 3, Táo đỏ vàng 2, Banana Lady Finger, Cantaloupe 2, Cherry Wax Red và Kaki.
Điều này là do tập dữ liệu không có bất kỳ biến thể nào xuất hiện trong nền của bất kỳ
hình ảnh nào. Như đã nêu trước đó, nền của từng phiên bản đã bị xóa, điều này làm cho bộ
dữ liệu trái cây này phù hợp với mô hình được đề xuất. Tuy nhiên, độ chính xác của Apple
Golden 1, Apple Red 3 và Apple Red Yellow 2 lần lượt là 0,97, 0,96 và 0,98 . Điều này là
do Apple Golden 1 giống Apple Golden 2 về màu sắc; tương tự như vậy, Apple Red 3 giống
Apple Red 2 và Apple Red Yellow 2 giống Apple Red Yellow 1. Độ chính xác tổng thể của mô
hình được đề xuất cho tất cả các loại trái cây trong quá trình đào tạo là 100%, như thể
hiện trong hình. Điều quan trọng cần lưu ý là việc áp dụng các kỹ thuật tiền xử lý khác
nhau trong mô hình đã giúp đạt được tỷ lệ chính xác cao.
Thông thường, các mô hình hoạt động tốt trong quá trình đào tạo và dưới dữ liệu được giám
sát. Tuy nhiên, khi nói đến dữ liệu trong thế giới thực, chúng thường không hoạt động tốt. Vì lý
do đó, chúng tôi đã thử nghiệm hiệu suất của mô hình được đề xuất bằng cách cung cấp cho nó dữ
liệu chưa nhìn thấy trong giai đoạn thử nghiệm. Bộ dữ liệu chứa các phiên bản hình ảnh cho mục
đích thử nghiệm. Điều quan trọng cần lưu ý là mô hình chưa từng thấy hình ảnh tập dữ liệu thử
nghiệm trước đây. Vì vậy, việc sử dụng bộ dữ liệu như vậy để thử nghiệm sẽ giúp xác định hiệu
suất hợp lý của mô hình được đề xuất mà không có bất kỳ sai lệch nào. Bảng 4 trình bày kết quả
thử nghiệm của mẫu TL-MobileNetV2 về độ chính xác, thu hồi, điểm F1 và hỗ trợ. Từ bảng, có thể
suy ra rằng mô hình được đề xuất đã đạt được độ chính xác tối đa trong tất cả các lớp trừ một số
ít, chẳng hạn như Apple Golden 1, Apple Red 3, Apple Red Yellow 2, Banana Lady Finger, Cantaloupe
2, Cherry Wax Red và Kaki. Độ chính xác của chúng lần lượt được ghi là 0,92, 0,96, 0,98, 0,92,
0,95, 0,92 và 0,94, trong khi điểm F1 của các loại quả này lần lượt là 0,94, 0,97, 0,96, 0,94, 0,96, 0,93
Điều này có thể là do có khả năng dự đoán âm tính sai giữa Vàng 1 và Vàng 2, cũng như
giữa Đỏ 1 và Đỏ 3, và Đỏ Vàng 1 và Đỏ Vàng 2 vì các lớp này tương tự nhau về màu sắc . Mô
hình đạt độ chính xác 99% trong cả giai đoạn huấn luyện và thử nghiệm. Điều này cũng

chứng tỏ rằng mô hình không quá phù hợp vì sẽ có sự khác biệt về điểm đào tạo và kiểm tra
của mô hình TL-MobileNetV2.

So sánh hiệu suất mô hình

Mô hình đề xuất được so sánh thêm với các mô hình nổi tiếng, như đã đề cập trong
Phần 2.2 (AlexNet [28], VGG16 [29], InceptionV3 [30] và ResNet [31]). Để có được sự so
sánh công bằng, các kỹ thuật tiền xử lý và điều chỉnh mô hình đã đề cập ở trên (được
thảo luận trong Phần 2.4) đã được áp dụng cho các mô hình đã đề cập với cùng số lần lặp lại.
Machine Translated by Google

Tính bền vững 2023, 15, 1906 10 trên 14

Bảng 5 thể hiện hiệu suất của các kiểu máy khác nhau so với kiểu máy TL-MobileNetV2.
Có thể suy ra rằng VGG16 hoạt động kém hơn về độ chính xác, trong khi InceptionV3
hoạt động tốt hơn một chút so với AlexNet và ResNet. Cũng có thể nhận thấy rằng
MobileNetV2 tốt hơn tất cả các kiểu máy khác, nhưng phiên bản sửa đổi của MobileNetV2,
TL-MobileNetV2, vượt trội hơn tất cả các kiểu máy được đề cập trong bảng. TL
MobileNetV2 đang hoạt động tốt hơn ở tất cả các tham số cho dù đó là độ chính xác,
khả năng thu hồi hay điểm F1. Điều này là do TL-MobileNetV2 là phiên bản sửa đổi của
MobileNetV2 với năm lớp bổ sung, đóng vai trò rất lớn trong việc cải thiện độ chính
xác của mô hình.

Bảng 3. Kết quả kiểm định mô hình TL-MobileNetV2.

Các loại trái cây Độ chính xác Nhớ lại Điểm F1 Ủng hộ

Táo Braeburn 1 1 1 4920

Táo Đỏ Tuyết 1 1 1 4440

Táo vàng 1 0,97 1 1 0,98 1 4800

Táo vàng 2 1 4920

Táo vàng 3 1 4810

Táo bà Smith 1 4920

Apple Pink Lady 1 4560

Táo đỏ 1 1 4920

Táo đỏ 2 1 4920

Táo đỏ 3 1 1 1 1 1 1 1 4290

Táo Đỏ Ngon 1 1 0,96 1 1 1 1 0,97 1 4900

Táo đỏ vàng 1 1 1 1 4920

Táo Đỏ Vàng 2 0,98 1 0,99 6720

Quả mơ 1 1 1 4920
Trái bơ 1 1 1 4270
Chuối 1 1 1 4900

ngón tay chuối 0,98 1 0,99 4500


chuối đỏ 1 1 1 4900
Rễ củ cải đỏ 1 1 1 4500

việt quất 1 1 1 4620


quả xương rồng 1 1 1 4900

dưa lưới 1 1 1 1 4920

dưa đỏ 2 0,99 1 1 4920


Quả khế 1 1 1 4920

quả anh đào


1 1 1 4920

Anh Đào Sáp Đen 1 1 1 4920

Anh Đào Sáp Đỏ 0,98 1 0,99 4920

Anh Đào Sáp Vàng 1 1 1 4920


hạt dẻ 1 1 1 4500
Clementine 1 1 1 4900
dừa 1 1 1 4900

màu xanh nho 1 1 1 4900

nho trắng 1 1 1 4920

bưởi hồng 1 1 1 4900

bưởi trắng 1 1 1 4920


Trái ổi 1 1 1 4900

quả lý gai 1 1 1 4900


kaki 0,97 1 0,99 4900
Quả kiwi 1 1 1 4660

quất 1 1 1 4710

- - 1
Sự chính xác 194.000
Macro trung bình
1 1 1 194.000
Trung bình có trọng số
1 1 1 194.000
Machine Translated by Google

Tính bền vững 2023, 15, 1906 11 trên 14

Bảng 4. Kết quả thử nghiệm model TL-MobileNetV2.

Các loại trái cây Độ chính xác Nhớ lại Điểm F1 Ủng hộ

Táo Braeburn 1 1 1 148

Táo Đỏ Tuyết 1 1 1 160

Táo vàng 1 0,92 1 0,94 164

Táo vàng 2 1 1 1 161

Táo vàng 3 1 0,96 1 164

Táo bà Smith 1 1 1 154

Apple Pink Lady 1 1 1 164

Táo đỏ 1 1 1 1 164

Táo đỏ 2 1 1 1 144

Táo đỏ 3 0,96 1 0,97 166

Táo Đỏ Ngon 1 1 1 164

Táo đỏ vàng 1 1 1 1 219

Táo Đỏ Vàng 2 0,98 0,94 0,96 164

Quả mơ 1 1 1 143

Trái bơ 1 1 1 166

Chuối 1 1 1 152

ngón tay chuối 0,92 1 1 0,94 1 166

chuối đỏ 1 1 1 150

Rễ củ cải đỏ 1 1 1 154

việt quất 1 0,97 1 1 164

quả xương rồng 164

dưa lưới 1 1 1 1 166

dưa đỏ 2 0,95 1 0,96 164

Quả khế 1 1 1 246

quả anh đào


1 1 1 164

Anh Đào Sáp Đen 1 1 1 164

Anh Đào Sáp Đỏ 0,92 1 0,93 153

Anh Đào Sáp Vàng 1 1 1 166


hạt dẻ 1 1 1 166
Clementine 1 1 1 328
dừa 1 1 1 164

màu xanh nho 1 1 1 166

nho trắng 1 1 1 166

bưởi hồng 1 0,99 1 166

bưởi trắng 1 1 1 166


Trái ổi 1 1 1 166

quả lý gai 1 1 1 166


kaki 0,94 1 0,95 164
Quả kiwi 1 156

quất 1 1 1 1 1 157

- - 0,99 6749
Sự chính xác

Macro trung bình


0,99 0,99 0,99 6749

Trung bình có trọng số


0,99 0,99 0,99 6749

Bảng 5. Hiệu năng của các mẫu khác nhau so với mẫu TL-MobileNetV2.

người mẫu Độ chính xác Nhớ lại Điểm F1

AlexNet 0,91 0,89 0,92


VGG16 0,88 0,90 0,88

InceptionV3 0,93 0,88 0,91


ResNet 0,89 0,92 0,90
MobileNetV2 0,96 0,97 0,96
TL-MobileNetV2 0,99 0,99 0,99

Hơn nữa, mô hình được đề xuất, TL-MobileNetV2, được so sánh với các mô hình mới
nhất về các tính năng định tính và định lượng của nó, như đã đề cập trong Bảng 6. Nó có thể
Machine Translated by Google

Tính bền vững 2023, 15, 1906 12 trên 14

được suy ra từ bảng rằng các mô hình khác nhau đã được đề xuất cho các bộ dữ liệu khác nhau, ví dụ:
bộ dữ liệu quả chà là, dứa, cà chua, dâu tây và thậm chí cả hỗn hợp trái cây. Một số mô hình này áp
dụng các kiến trúc nổi tiếng, chẳng hạn như ResNet hoặc MobileNetV2 và một số đã tạo mô hình của
chúng dựa trên CNN. Từ bảng, có thể kết luận rằng mô hình đề xuất của chúng tôi hoạt động tốt trên

bộ dữ liệu trái cây. Mô hình được đề xuất sửa đổi dựa trên MobileNetV2 đã hoạt động hiệu quả khi so
sánh với các mô hình khác và nhanh hơn nhiều cũng như chiếm ít không gian hơn trong khi xử lý. Ngoài
ra, kiến trúc này phù hợp nhất với tập dữ liệu đã thu thập vì nó được thu thập bằng máy ảnh di động.

Bảng 6. So sánh mô hình TL-MobileNetV2 với các phương pháp tiên tiến nhất.

Giấy tập dữ liệu Các lớp học Phương pháp/Mô hình Loại phân loại Sự chính xác (%)

[36] trái cây trộn 18 CNN Nhận biết 95.08


[37] quả chà là số 8 MobileNetV2 Nhận biết 99,0
[38] Quả dứa 1 CNN Nhận dạng/chất lượng 97,0
[39] Quả dâu ResNet Chất lượng 84
[40] Cà chua 1 1 SDF-convnets Chất lượng 96,5
TL-MobileNetV2 trái cây trộn 40 MobileNetV2 Nhận biết 99,0

4.Kết luận

Các kỹ thuật học máy, đặc biệt là những kỹ thuật phù hợp với thị giác máy tính, đã bắt đầu được
sử dụng rộng rãi trong nông nghiệp chính xác. Những kỹ thuật này được sử dụng trong nhiều lĩnh vực
khác nhau, chẳng hạn như phân loại trái cây, phân tích chất lượng, ước tính năng suất và dự đoán bệnh tật.
Thành công của những kỹ thuật này đã khuyến khích phát triển các mô hình học sâu để phân loại hạt
giống. Trong nghiên cứu này, một mô hình học sâu TL-MobileNetV2 được phát triển dựa trên kiến trúc
MobileNetV2. Một bộ dữ liệu gồm 40 loại trái cây đã được sử dụng để đào tạo và thử nghiệm mô hình đề
xuất. Trong mô hình TL-MobileNetV2, năm lớp khác nhau đã được thêm vào sau khi loại bỏ lớp phân loại
có trong kiến trúc MobileNetV2 để cải thiện hiệu quả và độ chính xác của mô hình. Cùng với điều này,
các kỹ thuật tiền xử lý và điều chỉnh mô hình khác nhau đã được sử dụng để làm cho TL-MobileNetV2
hoạt động tốt trên tập dữ liệu nói trên mà không bị quá khớp. Kết quả thử nghiệm cho thấy TL-
MobileNetV2 hoạt động tốt trên bộ dữ liệu trái cây với độ chính xác đạt 99%.

Trong công việc trong tương lai, một ứng dụng dựa trên thiết bị di động sẽ được tăng cường hơn
nữa bằng cách sử dụng số lượng lớn hơn các loại trái cây khác nhau, nhằm mục đích dẫn đến phạm vi
phân loại trái cây rộng hơn. Ứng dụng này sẽ giúp những người có kiến thức hạn chế phân loại các
loại trái cây khác nhau và các giống khác nhau của chúng. Hơn nữa, các mô hình CNN khác nhau sẽ được

đào tạo trên tập dữ liệu và kết quả của chúng sẽ được so sánh để xác định mô hình phù hợp nhất về độ
chính xác và hiệu quả.

Kinh phí: Nghiên cứu này được tài trợ bởi Cục phó Nghiên cứu và Đổi mới, Bộ Giáo dục ở Ả Rập Saudi,
theo số dự án INST199.

Tuyên bố của Ủy ban Đánh giá Thể chế: Không áp dụng.

Tuyên bố đồng ý có hiểu biết: Không áp dụng.

Tuyên bố về tính khả dụng của dữ liệu: Bộ dữ liệu được sử dụng trong nghiên cứu này là công khai [27].

Lời cảm ơn: Tác giả gửi lời cảm ơn tới Cục phó Nghiên cứu và Đổi mới, Bộ Giáo dục ở Ả-rập Xê-út đã
tài trợ cho nghiên cứu này thông qua dự án số INST199.

Xung đột lợi ích: Tác giả tuyên bố rằng không có xung đột lợi ích nào liên quan đến việc xuất bản
bài báo này.
Machine Translated by Google

Tính bền vững 2023, 15, 1906 13 trên 14

Người giới thiệu

1. Gulzar, Y.; Khan, SA Phân đoạn tổn thương da dựa trên Vision Transformers và Mạng lưới thần kinh tích chập—Một nghiên cứu so sánh. ứng dụng Khoa học. 2022,

12, 5990. [CrossRef]

2. Khan, SA; Gulzar, Y.; Turaev, S.; Peng, YS Một bộ mô tả HSIFT được sửa đổi để phân loại hình ảnh y tế của các đối tượng giải phẫu.

Đối xứng 2021, 13, 1987. [CrossRef]

3. Alam, S.; Raja, P.; Gulzar, Y. Điều tra các phương pháp học máy để dự đoán sớm các rối loạn phát triển thần kinh

còn bé. dây điện. cộng đồng. Đám đông. Điện toán. 2022, 2022, 5766386. [CrossRef]
4. Sahlan, F.; Hamidi, F.; Misrat, MZ; Quảng cáo, MH; Wani, S.; Gulzar, Y. Dự đoán về Sức khỏe Tâm thần của Sinh viên Đại học. quốc tế
J. Nhận thức nhận thức. Điện toán. 2021, 7, 85–91.
5. Hanafi, MFFM; Nasir, MSFM; Wani, S.; Abdulghafor, RAA; Gulzar, Y.; Hamid, Y. Hệ thống giám sát trình điều khiển dựa trên học sâu theo thời gian thực .

quốc tế J. Nhận thức nhận thức. Điện toán. 2021, 7, 79–84.

6. Kakani, V.; Nguyên, VH; Kumar, BP; Kim, H.; Pasupuleti, VR Một đánh giá quan trọng về thị giác máy tính và trí tuệ nhân tạo trong ngành công nghiệp thực

phẩm. J. Thực phẩm Nông nghiệp Res. 2020, 2, 100033. [CrossRef]

7. Behera, SK; Rath, AK; Mahapatra, A.; Sethy, Nhận dạng PK, Phân loại & Phân loại trái cây bằng Máy học & Trí thông minh Máy tính: Đánh giá. J. Môi trường xung

quanh. thông minh. nhân bản. Điện toán. 2020, 1–11. [Tham khảo chéo]
số 8.
Altaheri, H.; Alsulaiman, M.; Muhammad, G. Phân loại quả chà là để thu hoạch bằng robot trong môi trường tự nhiên bằng cách sử dụng học sâu. Truy cập

IEEE 2019, 7, 117115–117133. [Tham khảo chéo]

9. Shamim Hossain, M.; Al-Hammadi, M.; Muhammad, G. Phân loại trái cây tự động bằng cách sử dụng Deep Learning cho công nghiệp

Các ứng dụng. IEEE Trans. Ind. Thông báo. 2019, 15, 1027–1034. [Tham khảo chéo]

10. Gulzar, Y.; Hamid, Y.; Soomro, AB; Alwan, AA; Journaux, L. Một hệ thống phân loại hạt giống dựa trên mạng thần kinh tích chập.

Đối xứng 2020, 12, 2018. [CrossRef]

11. Hamid, Y.; Wani, S.; Soomro, AB; Alwan, AA; Gulzar, Y. Hệ thống phân loại hạt giống thông minh dựa trên kiến trúc MobileNetV2.

Trong Kỷ yếu của Hội nghị Quốc tế lần thứ 2 về Máy tính và Công nghệ Thông tin (ICCIT) năm 2022, Tabuk, Ả Rập Xê Út, 25–27 tháng 1 năm 2022; IEEE:

Piscataway, NJ, Hoa Kỳ, 2022; trang 217–222.

12. Hamid, Y.; Elyassami, S.; Gulzar, Y.; Balasarawathi, VR; Habuza, T.; Wani, S. Một mô hình CNN cải tiến để phát hiện hình ảnh giả. quốc tế J. Inf. công nghệ.

2022, 2022, 1–11. [Tham khảo chéo]

13. Saranya, N.; Srinivasan, K.; Pravin Kumar, SK; Rukkumani, V.; Ramya, R. Phân loại trái cây bằng máy học truyền thống

và Phương pháp học sâu; Springer: Chăm, Thụy Sĩ, 2020; Tập 1108, ISBN 9783030372170.

14. Rojas-Aranda, JL; Nunez-Varela, JI; Cuevas-Tello, JC; Rangel-Ramirez, G. Phân loại trái cây cho các cửa hàng bán lẻ bằng cách sử dụng Deep Learning;

Springer: Chăm, Thụy Sĩ, 2020; Tập 12088, ISBN 9783030490751.

15. Sridhar, B.; Kiran, KSS; Likhitha, N.; Vardhan, KPVA; Nikhil, KV Phát triển Phân loại Trái cây Tự động Sử dụng Lai

Mô hình Deep Learning cho Siêu thị; Springer: Singapore, 2022; Tập 838, ISBN 9789811685491.

16. Châu, C.; Hu, J.; Từ, Z.; Yue, J.; Ye, H.; Yang, G. Một hệ thống mới dựa trên nhà kính để phát hiện và đánh giá độ mọng của dâu tây bằng kỹ thuật học sâu

cải tiến. Đằng trước. Khoa học thực vật 2020, 11, 559. [CrossRef] [PubMed]

17. Mamat, N.; Othman, MF; Abdulghafor, R.; Alwan, AA; Gulzar, Y.; Malaysia, UT; Quốc vương, J.; Petra, Y. Tăng cường hình ảnh

Kỹ thuật chú thích phân loại trái cây bằng phương pháp học sâu. Tính bền vững 2023, 15, 901. [CrossRef]

18. Nasir, IM; Bibi, A.; Shah, JH; Khẩn, Th.S; Sharif, M.; Iqbal, K.; Nam, Y.; Kadry, S. Phân loại sâu bệnh trên cây ăn quả: Ứng dụng cho nông nghiệp chính

xác. Điện toán. mẹ. tiếp tục. 2020, 66, 1949–1962. [Tham khảo chéo]

19. Assuncao, E.; Diniz, C.; Gaspar, Giám đốc điều hành; Proenca, H. Hệ thống hỗ trợ ra quyết định để phân loại bệnh trên cây ăn quả bằng cách sử dụng Deep

Learning. Trong Kỷ yếu Hội nghị Quốc tế về Khoa học và Ứng dụng Hỗ trợ Quyết định năm 2020, Sakheer, Bahrain, ngày 8–9 tháng 11 năm 2020; trang 652–656.

20. Garillos-Manliguez, CA; Chiang, JY Học sâu đa phương thức thông qua hợp nhất muộn để phân loại độ chín của quả đu đủ không phá hủy . Trong Kỷ yếu của Hội

nghị quốc tế lần thứ 18 về Kỹ thuật điện, Khoa học máy tính và Điều khiển tự động CCE 2021–2021 , Thành phố Mexico, Mexico, ngày 10–12 tháng 11 năm 2021.

21. Herman, H.; Cenggoro, TW; Susanto, A.; Pardamean, B. Học sâu về phân loại độ chín của quả cọ dầu với Densenet.

Trong Kỷ yếu Hội nghị Quốc tế về Công nghệ và Quản lý Thông tin năm 2021, Jakarta, Indonesia, ngày 19–20 tháng 8 năm 2021; trang 116–119.

22. Suharjito; Elwirehardja, GN; Prayoga, JS Oil Palm Fresh Fruit Bunch Phân loại độ chín trên thiết bị di động bằng Deep

Phương pháp học tập. Điện toán. điện tử. nông nghiệp. 2021, 188, 106359. [CrossRef]

23. Mahmood, A.; Singh, SK; Tiwari, AK Phân loại quả táo tàu dựa trên học sâu được đào tạo trước theo cách của họ

Mức độ trưởng thành. thần kinh. Điện toán. ứng dụng 2022, 34, 13925–13935. [Tham khảo chéo]

24. Musacchi, S.; Serra, S. Chất lượng quả táo: Tổng quan về các yếu tố trước khi thu hoạch. Khoa học. làm vườn. 2018, 234, 409–430. [Tham khảo chéo]

25. SelectHealth.Org. Có sẵn trực tuyến: https://selecthealth.org/blog/2020/02/how-many-types-of-apples-are-there-and-which is-best (truy cập ngày 1 tháng 9 năm

2022).

26. Sander, M.; Howard, A.; Chu, M.; Zhmoginov, A.; Chen, L.-C. Mobilenetv2: Đảo ngược dư lượng và tắc nghẽn tuyến tính. Trong Kỷ yếu của Hội nghị IEEE về Tầm

nhìn Máy tính và Nhận dạng Mẫu, Thành phố Salt Lake, UT, Hoa Kỳ, ngày 18–22 tháng 6 năm 2018; trang 4510–4520.

27. Bộ dữ liệu Oltean, M. Fruits 360: Bộ dữ liệu hình ảnh chứa trái cây và rau quả 2019. Kaggle, 2020. [Trực tuyến]. Có sẵn

trực tuyến: https://www.kaggle.com/moltean/fruits (truy cập ngày 1 tháng 4 năm 2022).


Machine Translated by Google

Tính bền vững 2023, 15, 1906 14 trên 14

28. Krizhevsky, A.; Sutskever, tôi.; Hinton, GE Imagenet Phân loại với mạng thần kinh chuyển đổi sâu. quảng cáo Thông tin thần kinh
Quá trình. hệ thống. 2012, 25, 84–90. [Tham khảo chéo]

29. Simonyan, K.; Zisserman, A. Mạng tích chập rất sâu để nhận dạng hình ảnh quy mô lớn. arXiv 2014, arXiv:1409.1556.
30. Szegedy, C.; Vanhoucke, V.; Ioffe, S.; Shlens, J.; Wojna, Z. Suy nghĩ lại về Kiến trúc Khởi động cho Thị giác Máy tính. Trong Kỷ yếu của Hội nghị
IEEE về Tầm nhìn Máy tính và Nhận dạng Mẫu, Las Vegas, NV, Hoa Kỳ, ngày 27–30 tháng 6 năm 2016; trang 2818–2826.

31. Anh ấy, K.; Trương, X.; Ren, S.; Sun, J. Deep Residual Learning để nhận dạng hình ảnh. Trong Kỷ yếu của Hội nghị IEEE về Tầm nhìn Máy tính và Nhận
dạng Mẫu, Las Vegas, NV, Hoa Kỳ, ngày 27–30 tháng 6 năm 2016; trang 770–778.
32. Ayoub, S.; Gulzar, Y.; Tái chế, FA; Turaev, S. Tạo chú thích hình ảnh bằng cơ chế chú ý và chuyển đổi Bahdanau
Học hỏi. Đối xứng 2022, 14, 2681. [CrossRef]
33. Trang, F.; Tề, Z.; Duẩn, K.; Xi, D.; Chu, Y.; Chu, H.; Hùng, H.; Anh ấy, Q. Khảo sát toàn diện về học tập chuyển giao. Proc. IEEE 2020, 109, 43–
76. [Tham khảo chéo]

34. Tân, C.; Mặt trời, F.; Kông, T.; Trương, W.; Dương, C.; Liu, C. Một khảo sát về Deep Transfer Learning. Trong Kỷ yếu Hội nghị Quốc tế về Mạng nơ-
ron nhân tạo, Rhodes, Hy Lạp, ngày 4–7 tháng 10 năm 2018; Springer: Chăm, Thụy Sĩ, 2018; trang 270–279.
35. Arnold, TB KerasR: Giao diện R cho Thư viện Keras Deep Learning. J. Phần mềm mã nguồn mở. 2017, 2, 296. [CrossRef]
36. Trương, Y.; Thần kinh, SC; Wang, S. Phân loại loại trái cây theo Entropy Fourier phân số với lưới vectơ góc quay
và Bộ mã hóa tự động thưa thớt xếp chồng lên nhau. Hệ thống chuyên gia 2022, 39, e12701. [Tham khảo chéo]

37. Albarrak, K.; Gulzar, Y.; Hamid, Y.; Mehmood, A.; Soomro, AB Một mô hình dựa trên học tập sâu để phân loại quả chà là.
Tính bền vững 2022, 14, 6339. [CrossRef]
38. Huang, T.-W.; Bhat, SA; Huang, N.-F.; Chang, C.-Y.; Chan, P.-C.; Elepano, Dứa thời gian thực dựa trên trí tuệ nhân tạo AR
Phân loại chất lượng bằng quang phổ âm thanh. Nông nghiệp 2022, 12, 129. [CrossRef]
39. Su, Z.; Trương, C.; Yên, T.; Chu, J.; Zeng, Y.; Lữ, X.; Cao, P.; Phong, L.; Anh ấy, L.; Fan, L. Ứng dụng hình ảnh siêu phổ để xác định hàm lượng
chất rắn trưởng thành và chất rắn hòa tan của quả dâu tây bằng các phương pháp học sâu. Đằng trước. Khoa học thực vật 2021, 12, 1897. [CrossRef]

40. Ko, K.; Jang, tôi.; Choi, JH; Lim, JH; Lee, DU Quyết định ngẫu nhiên Sự kết hợp của các mạng thần kinh tích chập cho độ chín của cà chua
Phát hiện trong các hệ thống phân loại nông nghiệp. Cảm biến 2021, 21, 917. [CrossRef] [PubMed]

Tuyên bố miễn trừ trách nhiệm/Lưu ý của nhà xuất bản: Các tuyên bố, ý kiến và dữ liệu có trong tất cả các ấn phẩm chỉ là của (các) tác giả và (những)
người đóng góp chứ không phải của MDPI và/hoặc (những) người biên tập. MDPI và/hoặc (những) biên tập viên từ chối trách nhiệm đối với bất kỳ thương
tích nào đối với người hoặc tài sản do bất kỳ ý tưởng, phương pháp, hướng dẫn hoặc sản phẩm nào được đề cập trong nội dung.

You might also like