Professional Documents
Culture Documents
About SMCC
About SMCC
3. Thế mạnh...........................................................18
4. Các ứng dụng....................................................28
Các ứng dụng dành cho doanh nghiệp......................30
Các ứng dụng dành cho nhà nước.............................32
Các ứng dụng dành cho cá nhân ...............................33
.
1
Giới thiệu InfoRe
GIỚI
THIỆU Chúng tôi là ai ?
INFORE
1
Công ty cổ phần Công nghệ INFORE được thành lập vào tháng 4/2012
bởi các thành viên trẻ cùng có đam mê và kiến
Chọn lọc Thông tin INFORE là thức trong ngành Công nghệ thông tin (ICT).
công ty chuyên về ứng dụng Hội đồng sáng lập bao gồm các thành viên đã
học tập tại các trường đại học danh tiếng nước
Học máy (Machine Learning) ngoài, có học vị Thạc sĩ hoặc Tiến sĩ trong lĩnh
và Trí tuệ nhân tạo (AI) vực Quản trị kinh doanh hoặc Khoa học máy
tính và từng có kinh nghiệm làm việc tại các tập
đoàn hàng đầu trong lĩnh vực ICT như: Google,
Yahoo, France Telecom – Orange, HPC,…
4 5
Thành Tích Công Ty
Mục tiêu công ty
Hiện công ty đang vận hành phòng thí nghiệm riêng phục vụ việc nghiên cứu các
phương pháp ứng dụng và cải tiến kĩ thuật Xử lý tiếng Việt trên máy tính
Mục tiêu công ty hướng tới đó là thu hẹp khoảng cách giữa nghiên cứu
và ứng dụng, giữa học thuật và thực tiễn trong một số ngành của
Công nghệ thông tin như:
Năm 2016, InfoRe và sản phẩm của công ty, SMCC - Hệ thống
lắng nghe, phân tích dữ liệu mạng xã hội, đã đoạt giải Quán quân của
giải thưởng Nhân tài Đất Việt danh giá
6 7
2
Giới thiệu SMCC
SMCC là tên viết tắt tiếng anh của cụm từ Social Media Command Center
(Trung tâm điều phối tương tác truyền thông trên mạng xã hội).
GIỚI
THIỆU
SMCC
SMCC kết hợp giữa các công nghệ phân tích, thu thập dữ liệu tự động và các
biện pháp xử lý, phản ứng, giải quyết vấn đề của con người, là một giải pháp
trọn gói giúp các doanh nghiệp hoặc tổ chức tương tác với cộng đồng mạng
xã hội theo các chiến lược, cách thức an toàn, nhanh chóng, hiệu quả, chính
xác và ổn định nhất
8 9
Công nghệ sử dụng Cơ chế hoạt động
Cơ chế hoạt động, lưu trữ, phân tích và truy xuất thông tin
Nền tảng công nghệ cốt lõi của của hệ thống SMCC dựa trên lý thuyết về Học máy
(Machine Learning), Trí tuệ nhân tạo (Artificial Intelligence) và Học nhiều lớp (Deep Learning) của hệ thống SMCC
Đó là những xu hướng chủ động trong ngành Công nghệ thông tin trên toàn thế giới. Từ đó,
công ty tự xây dựng và phát triển các công nghệ lõi của hệ thống SMCC bao gồm: Crawler Controller sẽ tiến hành điều khiển hệ thống quét dữ liệu (crawler)
Dữ liệu về các nguồn tài nguyên cần thu thập được lấy từ Crawler Database.
Cơ sở dữ liệu này được cập nhật một phần bởi người dùng và một phần bởi
Hệ thống thu thập thông tin tự xây Engine xử lý ngôn ngữ Tiếng Việt tự quá trình lan truyền liên kết trên Internet.
dựng dựa trên kĩ thuật phát hiện xây dựng dựa trên sự kế thừa kinh
nội dung mới linh động, theo thời nghiệm của nhiều chuyên gia xử lý Mỗi trung tâm dữ liệu của mỗi nhà cung cấp sẽ có hàng trăm đến hàng nghìn
gian thực ngôn ngữ Tiếng Việt đầu ngành crawlers hoạt động cùng lúc để đảm bảo hoạt động thông suốt và tránh các
quá trình chặn nguồn truy cập của các tài nguyên trên Internet
Thông qua các điểm trung chuyển lưu lượng Internet trên thế giới, và được
Hệ thống trí tuệ nhân tạo tự động Hệ thống máy chủ lưu trữ, xử lý gửi về các gateway ở Việt Nam đặt ở các nhà cung cấp Internet (ISP) khác
nhận dạng giọng nói và chữ viết dữ liệu lớn, đáp ứng nhanh, kết nối nhau như VDC, FPT, CMC, Netnam để giảm thiểu rủi ro mất mát hay chậm
(chữ in trên báo giấy) tự phát triển mạng riêng ảo (VPN) đảm bảo bảo thông tin do vấn đề đường truyền
mật
Các thông tin sau khi đến Gateway ở Việt Nam sẽ được truyền về hệ thống
thu thập dữ liệu trung tâm Raw Data Queue để tiến hành xử lí, phân tích trên
Data Analysis Cluster và đưa các thông tin phân tích, trích xuất được vào hệ
thống máy tìm kiếm tốc độ cao High Speed Search Engine. Đồng thời, dữ liệu
thô cũng như tiền xử lí sẽ được lưu vào hệ thống lưu trữ Backup System để
phục vụ các quá trình xử lí khác sẽ phát sinh sau này
Để truy xuất dữ liệu, một hệ thống API Servers sẽ cung cấp các API ở mức
cao hơn cho phép các thiết bị đầu cuối (điện thoại, máy tính, v.v..) truy cập các
thông tin dưới dạng thống kê và tổng hợp
Hệ thống cảnh báo Alert System sẽ truy cập và theo dõi dựa trên các API để
báo về các thiết bị cập nhật tin tức tức thời như thư điện tử, tin nhắn mà hệ
thống tự động phát hiện được qua hệ thống Post Analysis
Do cơ chế kiểm soát lấy dữ liệu của Facebook và trở ngại khi truy cập các trang blog nhạy cảm, giải pháp SMCC sử
dụng các hệ thống proxy động để phục vụ cho nhu cầu lấy dữ liệu. Các máy chủ proxy này được phân bố rải rác ở
Việt Nam và nước ngoài với số lượng phụ thuộc lượng dữ liệu cần thu thập của SMCC. Các proxy này hoạt động
như cửa ngõ thu thập thông tin của SMCC, có thể được thay đổi liên tục nhằm vượt qua các tường lửa chống thu
thập thông tin của mạng xã hội
10 11
Cơ chế hoạt động
SMCC dựa trên hệ thống máy chủ lưu trữ phân tán (SAN Storage),
12 13
Phát hiện đối tượng khả nghi
Chức năng và Tính năng Không những có thể theo dõi tự động các đối tượng, SMCC còn có thể tự động lọc, phân
loại và phát hiện các đối tượng khả nghi dựa vào hoạt động, mức độ tương tác và sắc thái
tình cảm, ngữ nghĩa nội dung các bài viết của những người này. Khi các đối tượng được
nhận diện là khả nghi, danh sách của họ kèm theo chi tiết các hoạt động được gửi cho
những người dùng chuyên trách của SMCC để đưa vào danh sách theo dõi hoặc có các biện
pháp hành động khác
Phát hiện xu hướng tiêu cực và cá nhân đưa nguồn tin gốc
Phát hiện các tài khoản hoặc nhóm tài khoản nghi vấn
Dựa vào lượng thông tin thu thập về rất lớn và liên tục biến động, SMCC phân tích và nhận
liên quan tới một chủ đề nhất định dạng các xu hướng nội dung tiêu cực xuất hiện trên mạng xã hội, đồng thời cảnh báo cho
SMCC có thể phát hiện các tài khoản hoặc nhóm tài khoản mạng xã hội (ở đây là Face- những người quản trị hệ thống. Các xu hướng tiêu cực này có thể được định nghĩa bởi
book) có số lượt tương tác, số lượt chia sẻ, hoặc số lần đăng bài cao một cách bất thường những người quản trị hoặc được xác định tự động bởi máy tính. Hệ thống cũng rà quét
về một chủ đề thường xuyên và đảm bảo đưa ra cho cơ quan chức năng cá nhân đưa nguồn tin gốc.
Phát hiện các nguồn tin và tài khoản phát tán tin gốc
SMCC có khả năng truy ra được thông tin đầy đủ về nguồn tin gốc (thông tin tác giả, ngày Phân loại, thống kê nội dung
giờ đăng, số lượt tương tác…) của bất kì một thông tin được chia sẻ nào trên mạng xã hội. Tính năng Phân loại, thống kê nội dung của SMCC cho phép người sử dụng hệ thống dễ
Đặc biệt ngay cả khi nguồn tin gốc đã được xóa đi, một sao lưu dữ liệu vẫn được lưu trữ dàng tiếp cận các loại thông tin theo nhiều nhóm khác nhau, được phân loại tự động. Ngoài
trên hệ thống ra, các thống kê về nội dung cho phép người sử dụng SMCC dễ dàng có cái nhìn tổng quan
hơn về dòng chảy thông tin hiện tại trên MXH mà không buộc phải đọc quá nhiều nội dung
Thu thập thông tin đa hướng
SMCC có khả năng thu thập thông tin đa hướng ở tốc độ cao. Tối tượng thu thập thông Thông báo, cảnh báo thông tin
tin của SMCC không giới hạn ở một số lượng lớn các nguồn dữ liệu bất kì trên mạng xã
Người sử dụng hệ thống SMCC không chỉ có thể tham vấn thông tin qua hệ thống Hiển thị
hội Facebook (với điều kiện đó là nguồn thông tin mở), từ các trang nhóm tới các trang cá
dữ liệu mà còn có thể nhận được các thông báo, cảnh báo thông tin tức thời thông qua thư
nhân, các nguồn tin Blog
điện tử và hệ thống nhắn tin SMS tùy theo lựa chọn. Ngoài các thông báo tức thời, hệ thống
cũng có những thông báo tóm tắt tình hình theo ngày, theo tuần, dựa trên các cụm từ khóa
Phát hiện và cảnh báo các nguồn tin nhạy cảm và những cá nhân được theo dõi
theo nhiều chủ đề khác nhau
SMCC có khả năng phân loại nguồn tin theo các chủ đề được cấu hình ví dụ như chủ đề Xuất báo cáo theo nhiều khuôn dạng
thời sự, tin trong nước, tin quốc tế … nhờ đó có thể phát hiện được những nguồn tin có
lượng tương tác đột biến bất thường theo từng chủ đề SMCC có thể trích xuất nhiều loại báo cáo tương ứng với những đối tượng thông tin được
lưu trữ trên hệ thống, ở các định dạng, khuôn dạng phổ biến như doc, pdf, xls, csv tùy theo
mục đích sử dụng dữ liệu
Phát hiện, phân tích và cảnh báo các xu hướng
xã hội trên các nguồn Máy tìm kiếm tốc độ cao
SMCC có khả năng phát hiện ra các xu hướng xã hội tiềm tàng ở thời điểm ban đầu và SMCC thu thập sau khi xử lý có thể truy vấn trên một máy tìm kiếm tốc độ cao, được thiết
đưa ra cảnh báo nến xu hướng có khả năng bùng phát kế và tối ưu chuyên biệt cho việc tìm kiếm dữ liệu văn bản, có thể trả về các kết quả chính
xác từ hằng triệu bản ghi dữ liệu chỉ trong thời gian chưa tới một giây, các kết quả xuất hiện
trong hệ thống bao gồm:
Theo dõi cá nhân tự động
SMCC phục vụ các công tác nghiệp vụ an ninh là khả năng theo dõi các cá nhân một Tìm kiếm người dùng tại các địa điểm (tỉnh thành) xác định có quan tâm tới một chủ đề nào đó.
cách tự động. Bất kì cá nhân nào sau khi được đưa vào danh sách theo dõi, các hoạt Thứ hạng tìm kiếm trả về những người dùng có quan tâm nhiều nhất tới chủ đề đó thông qua các
động công khai của họ trên mạng xã hội đều được hệ thống nhận dạng và phân tích, bài viết, status, like, comment, share liên quan.
báo cáo đầy đủ. Tìm kiếm các bài viết, các feed facebook theo các chủ đề ngữ nghĩa khác nhau.
Đối với các cá nhân khác có hoạt động trên những nguồn thông tin được SMCC theo Tìm kiếm các từ khóa nổi bật, các link được các trang blog chia sẻ và bình luận nhiều cũng như
dõi, các hoạt động của họ cũng được ghi lại đầy đủ, chi tiết thái độ bình luận tốt xấu của người dung
14 15
Chức năng và Tính năng Các đối tác phát triển
Từ các chức năng trên, hệ thống SMCC Các khách hàng đã và đang sử dụng dịch vụ
bao gồm 21 tính năng cụ thể:
16 17
3 THẾ
Có nền tảng Có khả năng mở
công nghệ tốt rộng và truy cập
từ xa
18 19
Các tiêu chí đánh giá công cụ Social Lisening
trên thế giới và tại Việt Nam
20 21
Các tiêu chí đánh giá công cụ Social Lisening
trên thế giới và tại Việt Nam
Tiêu chí về khả năng tương tác Tương tác khách hàng
Đối với khách hàng đăng tải thông tin trên trang mạng
Cập nhật thông tin trên trang mạng xã hội của đơn của đơn vị sử dụng, Người sử dụng có thể trả lời trực
vị sử dụng: tiếp bài viết của khách hàng trên phần mềm mà không
cần đăng nhập vào từng trang mạng riêng lẻ)
Phần mềm có nhiều tab là các trang mạng xã hội (Facebook,
Youtube) là trang mạng được đăng ký của đơn vị sử dụng. Lọc thông tin và tổng hợp những người có ảnh hưởng
(influencer) có liên quan tới đơn vị sử dụng: Top influ-
Tại các tab này, thông tin trên các trang đã được đăng ký encer; Follower của đơn vị sử dụng; đơn vị sử dụng fol-
liên tục cập nhật như trên chính trang đó. low trang đó; hoặc là Influencer đã từng nhắc tới đơn
.Phần mềm cho phép đăng ký nhiều hơn 1 trang Facebook. vị sử dụng trong 1 đăng tải của họ.
Cho phép người sử dụng – tại bất kỳ khu vực hoặc bộ
Đăng tải bài viết phận nào – có thể phản hồi nhanh chóng các tin nhắn,
Cho phép đăng tải bài viết trên các trang mạng của đơn vị đề cập và nhận xét trên một bảng điều khiển (dash-
sử dụng ngay trên phần mềm. board) duy nhất.
Cho phép đặt lịch tự động đăng bài viết đã lên lịch sẵn. Cho phép đánh dấu nội dung cần lưu ý.
Nội dung lưu ý được chia thành các nhóm: lưu ý, cần
trả lời (prefer)
22 23
So sánh chi tiết các giải pháp So sánh chi tiết các giải pháp
Social Listening Việt Nam Social Listening nước ngoài và Việt Nam
CÁC GIẢI PHÁP CÔNG NGHỆ TẠI VIỆT NAM CÁC GIẢI PHÁP CÔNG NGHỆ TẠI NƯỚC NGOÀI
Có nền tảng Có nền tảng Có nền tảng Có nền tảng Có nền tảng Có nền tảng Không có nền Không có nền Có nền tảng Có nền tảng
công nghệ cao công nghệ công nghệ nhưng công nghệ công nghệ công nghệ nhưng tảng công nghệ tảng công nghệ công nghệ nhưng công nghệ nhưng
TIÊU CHÍ VỀ không áp dụng nhưng không nhưng không không áp dụng không áp dụng không áp dụng
CÔNG NGHỆ được với Tiếng áp dụng được áp dụng được được với Tiếng được với Tiếng được với Tiếng
Việt với Tiếng Việt với Tiếng Việt Việt Việt Việt
TIÊU CHÍ VỀ Có khả năng Không có giải Không có giải Có giải pháp Không có giải Có khả năng Không có khả Có khả năng Có khả năng Có khả năng
mở rộng và pháp cho trung pháp cho trung cho chung tâm pháp cho trung mở rộng và năng mở rộng và mở rộng và mở rộng và
HỆ THỐNG
truy cập từ xa tâm theo dõi tâm theo dõi theo dõi trong tâm theo dõi truy cập từ xa mở rộng và truy cập từ xa truy cập từ xa truy cập từ xa
THEO DÕI
lĩnh vực ngân truy cập từ xa
hàng
TIÊU CHÍ VỀ Có khả năng Không có khả Không có khả Không có Không có khả Có khả năng Không có khả Không có khả Không có khả Có khả năng
KHẢ NĂNG tùy biến cao năng tùy biến năng tùy biến khả năng tùy năng tùy biến tùy biến cao năng năng năng tùy biến cao
cao cao biến cao cao tùy biến cao tùy biến cao tùy biến cao cho các mục
TÙY BIẾN
đích liên quan
đến marketing
TIÊU CHÍ VỀ Có khả năng Không có Không có khả Không có Không có Chỉ phù hợp Chỉ phù hợp Đặc thù, không Chỉ phù hợp Chỉ phù hợp
KHẢ NĂNG tích hợp cao khả năng tích năng tích hợp khả năng tích khả năng với những với mục đích có khả năng với những với những
hợp hợp vì thiếu tích hợp công ty nghiên cứu tích hợp công ty công ty
TÍCH HỢP
công nghệ thương mại thương mại thương mại
phân tích tự
TIÊU CHÍ VỀ Có khả năng Có khả năng Có khả năng Có khả năng Không có khả Có khả năng Khả năng Có khả năng Có khả năng Có khả năng
tương tác cao tương tác cao tương tác cao tương tác cao năng tương tương tác cao tương tác tương tác cao tương tác cao tương tác cao
KHẢ NĂNG
tác cao thấp, chỉ dùng
TƯƠNG TÁC để lấy dữ liệu
nghiên cứu
24 25
Hiệu quả tuyệt vời
Việc lựa chọn công nghệ về Học máy (Machine Learning) và Trí tuệ nhân tạo (AI) đã
phát triển hệ thống SMCC trở thành một trong những giải pháp tối ưu nhất tổng hợp
và phân thích thông tin trên Internet mang đến một lưu lượng dữ liệu lớn nhất trên Nguồn nhân lực chuyên nghiệp,
thị trường Việt Nam hiện nay, tương đương với 30% tổng dữ liệu của thị trường có nhiều kinh nghiệm và kĩ năng trong
các lĩnh vực về công nghệ, phân tích
dữ liệu và marketing:
Hơn 3500 đầu báo Hơn 5 triệu fanpages Hơn 50 diễn đàn
Chi phí và tính hiệu quả
Bạn sẽ có được tất cả những tính
năng ưu việt trên với mức chi phí duy
trì dịch vụ rất cạnh tranh.
26 27
4
Các hướng ứng dụng của SMCC
CÁC
ỨNG
Quan hệ khách hàng Quản trị thương hiệu Quản trị rủi ro
DỤNG
Quản trị nhân lực Quan hệ công chúng Tích hợp hệ thống
28 29
Các ứng dụng cho doanh nghiệp
Credit Scoring
Lead Generation Đánh giá điểm tín dụng của khách hàng, ứng dụng cho các dịch vụ cho vay, thế chấp,…
Từ việc phân tích nhu cầu người dùng, tạo ra tập khách hàng cho doanh
nghiệp và xây dựng các hồ sơ sử dụng cho các mục đích khác như bán chéo
sản phẩm, dịch vụ Làm giàu dữ liệu khách hàng
Hệ thống hỗ trợ bổ sung thêm các trường thông vào database của doanh nghiệp và liên
tục cập nhật thông tin
Nắm bắt xu hướng tức thời
Hệ thống SMCC hỗ trợ việc phát hiện và nhanh chóng nắm bắt các nội dung Chatbot
được lây lan nhanh trên MXH, từ đó sử dụng cho việc xây dựng các chiến dịch
Tự động hoá các quy trình và công việc chăm sóc khách hàng như kênh chat
truyền thông
hoặc điền thủ tục đăng ký thông tin
30 31
Các ứng dụng cho nhà nước Các ứng dụng cho cá nhân
Khai phá các liên hệ xã hội Xây dựng danh sách nghi vấn
Phân tích các mối quan hệ xã hội trên internet Phân tích các nguồn thông tin, tần suất đăng
của các đối tượng cần nghiên cứu, từ đó bổ tải và nội dung đăng tải để thiết lập danh sách
sung các cơ sở, động cơ hành vi của đối tượng các nhóm đối tượng cần theo dõi
Cổng thông tin MXH Cập nhật xu hướng kịp thời Tìm kiếm khách hàng theo từ khóa
Nắm bắt, phân tích các xu hướng thông tin nổi Dễ dàng tìm được danh sách khách hàng và
Tổng hợp các nội dung trên MXH và phân loại
bật để sản xuất các nội dung lây lan, tăng sự trực tiếp tiếp cận khách hàng để tăng doanh
để phục vụ nhu cầu ra quyết định của đơn vị
chú ý và độ phổ biến trên MXH thu
hành chính, tương tác trực tiếp với người dân
trên MXH. Ngoài ra còn có thể giám sát liên
tục các nguồn thông tin và phát hiện ra các
nguy cơ mất an toàn và xử lý kịp thời
32 33
34 35
+0912 2121 212
smcc@orm.vn
Facebook.com/smcc.vn
602, Tháp 1, Tòa nhà Times Tower,
35 Lê Văn Lương, Hà Nội
36