Professional Documents
Culture Documents
Đề xuất mô hình tổ chức quản lý kho dữ liệu công trình khoa học và công nghệ tại trường đại học giao thông vận tải thành phố Hồ Chí Minh - 1244291
Đề xuất mô hình tổ chức quản lý kho dữ liệu công trình khoa học và công nghệ tại trường đại học giao thông vận tải thành phố Hồ Chí Minh - 1244291
TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016
nhiều nguồn dữ liệu, nhiều môi trường khác 1, 2, 3, 4 và 5), phần nào đáp ứng được nhu
nhau. cầu của ngành giao thông vận tải, mặt khác
Trong những năm qua, đặc biệt trong đã góp phần giải quyết một số vấn đề trong
giai đoạn 2011 - 2015, công tác NCKH của công tác giảng dạy và học tập cũng như hợp
Nhà trường đã đạt được những kết quả đáng tác, liên kết quốc tế trong đào tạo của Nhà
khích lệ cả về số lượng và chất lượng (bảng trường.
Bảng 1. Số lượng đề tài NCKH giai đoạn 2011-2015.
Loại đề tài NCKH/Dự án
Năm
Cấp Bộ Cấp Cơ sở Sinh viên
2011 07 14 14
2012 07 15 16
2013 08 24 17
2014 06 12 24
2015 05 39 16
Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.
Bảng 2. Số cán bộ giảng viên, người học tham gia NCKH giai đoạn 2011-2015.
Loại đề tài NCKH/Dự án
Năm
Cấp Bộ Cấp Cơ sở Sinh viên
2011 85 70 56
2012 80 75 62
2013 96 120 66
2014 76 36 70
2015 68 103 58
Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.
Bảng 3. Số bài báo khoa học công bố trên các Tạp chí/Hội nghị, hội thảo khoa học giai đoạn 2011-2015.
Số bài báo khoa học đăng trên tạp chí Số bài báo khoa học đăng trong kỷ
Năm khoa học chuyên ngành yếu hội nghị, hội thảo
Bảng 5. Số lượng bài báo đăng trên tạp chí, ấn phẩm xuất bản có chỉ số, giai đoạn 2011-2015.
Loại ấn phẩm
Năm Kỷ yếu hội nghị có chỉ số Kỷ yếu hội nghị không có
Tạp chí
ISBN chỉ số ISBN
2011 19 - -
2012 101 - -
2013 118 - 81
2014 106 - -
2015 76 45 -
Nguồn: Báo cáo thống kế - phòng KHCN-NC&PT.
Việc quản lý các đề tài, bài báo, giáo Quá trình khai thác tri thức không chỉ là
trình, tài liệu tham khảo hiện nay chủ yếu là một quá trình tuần tự từ bước đầu tiên đến
trên bản cứng, các thông tin đăng tải trên bước cuối cùng mà là một quá trình lặp và có
mạng nội bộ mới chỉ dừng lại ở mức thống quay trở lại các bước đã qua.
kê. Với tốc độ phát triển ngày càng nhiều đề 3. Mô hình quản lý khoa học công
tài, công trình nghiên cứu,… thì việc quản lý nghệ
và triển khai, khai thác như hiện tại là không 3.1. Kho dữ liệu Kho dữ liệu
đáp ứng được nhu cầu thực tiễn, mặt khác
Chúng tôi đã thiết kế mô hình kho dữ
việc truy xuất dữ liệu phục vụ báo cáo về
liệu KHCN có cấu trúc, dựa trên những dữ
khoa học công nghệ là tốn khá nhiều thời
liệu đang có sẵn của Nhà trường và đưa tất cả
gian, bất tiện, không khoa học. Vì vậy, việc
tập trung vào kho dữ liệu này. Tất cả những
xây dựng kho dữ liệu tập trung về quản lý
yêu cầu truy xuất đến dữ liệu của kho dữ liệu
KHCN là nhu cầu tất yếu để khắc phục
sẽ cho kết nối theo chuẩn quy định. Ngoài
những hạn chế ở trên.
bốn mô đun chức năng đã được thiết kế để
2.2. Khai phá dữ liệu luôn phục vụ cho công tác quản lý khoa học
Khai phá dữ liệu (Data mining) [5] là chúng tôi còn tạo ra những cổng giao tiếp
quá trình khám phá các tri thức mới và các tri riêng cho phép những ứng dụng khác có thể
thức có ích ở dạng tiềm năng trong nguồn dữ kết nối vào để truy vấn dữ liệu.
liệu đã có. Khai phá dữ liệu là một bước của
quá trình khai thác tri thức (Knowledge
Discovery Process), bao gồm:
- Xác định vấn đề và không gian dữ liệu
để giải quyết vấn đề (Problem understanding
and data understanding).
- Chuẩn bị dữ liệu (Data preparation),
bao gồm các quá trình làm sạch dữ liệu (data
cleaning), tích hợp dữ liệu (Data integration),
chọn dữ liệu (Data selection), biến đổi dữ
liệu (Data transformation).
- Khai thác dữ liệu (Data mining): Xác
định nhiệm vụ khai thác dữ liệu và lựa chọn
kỹ thuật khai thác dữ liệu. Kết quả cho ta một Hình 1. Mô hình kho dữ liệu KHCN.
nguồn tri thức thô. 3.2. Hệ thống quản lý KHCN
- Đánh giá (Evaluation): Dựa trên một số - Quản lý đề tài: Cho phép quản lý tất
tiêu chí tiến hành kiểm tra và lọc nguồn tri cả các loại đề tài của CB - CNV trong trường
thức thu được. như: Đề tại cấp sơ cở; đề tại cấp bộ; đề tài
- Triển khai (Deployment). cấp nhà nước….Chức năng này hỗ trợ rất tốt
6
Journal of Transportation Science and Technology, Vol 20, Aug 2016
cho phép chọn lọc những đề tài đã nghiệm Nếu chúng ta thực hiện đồng bộ các giải
thu, hay chưa nghiệm thu… pháp như đã nêu thì chắc chắn, bức tranh
- Quản lý tạp chí: Tất cả các bài báo KHCN của Trường ta sẽ ngày càng sáng nét
trong các số tạp chí đều được tổ chức quản lý hơn; những kết quả mà NCKH và chuyển
theo từng số xuất bản của tạp chí theo định giao công nghệ tạo ra sẽ chắc chắn có chất
kỳ. Từ đó, dễ dàng tìm kiếm các bài báo cho lượng cao, đủ khả năng ứng dụng, góp phần
những lúc cần thiết. giải quyết các vấn đề quan trọng của địa
- Quản lý bài báo: Tất cả các bài báo phương, ngành, của quốc gia, mà trước mắt
hội nghị, bài báo tạp chí trong nước hay quốc là góp phần đắc lực nâng cao công tác quản
đề đều được tổ chức cập nhật thường xuyên lý KH CN của Nhà trường
thông qua chức năng này. Tài liệu tham khảo
- Quản lý giáo trình: Quản lý tất cả bài [1] Kế hoạch chiến lược phát triển dài hạn (2010-2020) và
tầm nhìn đến năm 2030, Trường Đại học Giao thông
giảng chi tiết hay giáo trình của Nhà trường vận tải Thành phố Hồ Chí Minh.
nhằm phục vụ sinh viên… [2] Vũ Ngọc Bích, Hồ Hải Vinh, Nguyễn Hải Dương,
.Nâng cao chất lượng công tác nghiên cứu khoa học
3.3. Phân tích dữ liệu trong trường đại học Giao thông vận tải Tp. Hồ Chí
Trên cơ sở các mô đun được thiết kế ở Minh, Tạp chí khoa học công nghệ giao thông vận tải,
trên cho phép chúng ta tương tác qua kho dữ số 13, tháng 11/2014, trang 03-06.
liệu như: Thêm, xóa sửa, cập nhật thông tin. [3] Nguyễn Vân Anh, Lê Vũ Toàn (2012), Tạp chí hoạt
động khoa học –Bộ KH&CN, số ISSN 1859-4794, số
Với dữ liệu ngày càng được cập nhật và thêm 635, tháng 4/2012, trang 57-60.
vào, trên cơ sở đó, chúng ta có thể trích xuất [4] Bischoff, J. and T. Alexander, Data warehouse:
và khai phá, phân tích dữ liệu để hỗ trợ ra practical advice from the experts1997: Prentice-Hall,
quyết định hay đưa ra tư vấn cho những vấn Inc.
đề liên quan đến công tác KHCN. Có thể dựa [5] https://vi.wikipedia.org/wiki/Khai_phá_dữ_lliệu
trên những thuật toán và đưa ra những thống [6] https://en.wikipedia.org/wiki/Weka_(machine_lea
kê phân tích tự động nhanh chóng. Hoặc rning).
cũng có thể trích xuất ra và xử dụng những Ngày nhận bài: 25/07/2016
công cụ hỗ trợ phân tích như Weka [6] để Ngày chuyển phản biện: 29/07/2016
phân tích. Ngày hoàn thành sửa bài: 16/08/2016
Ngày chấp nhận đăng: 23/08/2016
4. Kết luận
Trong bài báo này, tác giả đã giới thiệu
được mô hình tổng quan trong việc quản lý
và hoạt động KHCN của Nhà trường. Như:
Xây dựng được kho dữ liệu KHCN tập trung;
giới thiệu được hệ thống kết nối đến kho dữ
liệu tập trung này và đưa ra một số giải pháp
để phân tích khai phá dữ liệu khoa học nhằm
phục vụ trong công tác của Nhà trường.