Welcome to Scribd!

Skip carousel

7 29进度汇报

Uploaded by

王翼飞

0% found this document useful (0 votes)

10 views14 pages

Original Title

7.29进度汇报

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

10 views14 pages

7 29进度汇报

Uploaded by

王翼飞

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 14

Search inside document

Week 5.

5 Discussion
Outline 01 项目进展
C A T A L O G

02 后续工作的思路

03 分工
进展及问题

对实验的整体流程有大概把握

考虑使用服务器来进行实验

实质成果几乎为 0
后续工作的思路

01 整体流程概览

02 第一步：数据分析

03 文本分类论
文
撰
写
04 异常检测

04 结果评估
整体流程 2) Text Categorize

NLP
Category Snapshot of
Models
1 App Store
LDA
Category
2
App BERT … OC-SVMs input
Description …… Category
M
Isolation Prediction
App Store Forests Model
Label
1
Privacy Label ……
output
Labels 2 Machine learning
…
models
Label Malware
N

1) Retrieve Data (Solved) 3) Malware Detection 4) Outcome evaluation

后续工作的思路

01 整体流程概览

02 第一步：数据分析

03 文本分类论
文
撰
写
04 异常检测

04 结果评估
配环境

遇到的问题：在服务器上操作是否会效率更高？
数据分析

统计方法：逐个读取文件夹下的文件，转化为 json 格式，按照字典查找的方式

问题：
有的特殊文件会引发异常，尝试用 try-except 解决
统计一次耗时 1.5 小时

列表字符串 python 多线程 spark hadoop map-reduce 并行计算

数据分析 -- 两个维度

按类统计

每类多少个 app ，其中多少个有

label ，多少个没有 label
数据分析 -- 两个维度

按标签分析

定义一个类来统计

DATA_LINKED_TO_YOU DATA_NOT_LINKED_TO_YOU DATA_USED_TO_TRACK_YOU 使用情况

最底层

问题：第三个文档是否包含于前两个？
文本分类

所有语言翻译成英文
思路： pygtrans

去除停用词 +stemming
思路：正则表达式 nltk

机器学习分类
特殊类别：游戏、贴纸
思路： mallet bert 多试几个类
异常检测

label 向量的构造
没想好拍平

机器学习
sklearn 调参（右图）
评估

整体效果 baseline
步骤必要性
扩展性复杂度
分工

精通机器学习
Document22 pages
精通机器学习
Jason
No ratings yet
用户画像涂鸦智能文档中心
Document6 pages
用户画像涂鸦智能文档中心
Nelson Chan
No ratings yet
5 张科蚂蚁AI工程实践分享
Document22 pages
5 张科蚂蚁AI工程实践分享
sekiftlyz
No ratings yet
Java学习路径
Document1 page
Java学习路径
以少年之名
No ratings yet
518148678774533Java架构师实战训练营课程大纲
Document1 page
518148678774533Java架构师实战训练营课程大纲
一世长安
No ratings yet
机器学习分类问题及算法研究综述杨剑锋
Document5 pages
机器学习分类问题及算法研究综述杨剑锋
Chou Charles
No ratings yet
Version Control Specification
Document8 pages
Version Control Specification
li hyperion
No ratings yet
Pattern Recognition
Document22 pages
Pattern Recognition
David Zambrano
No ratings yet
《Python大战机器学习：数据科学家的第一个小目标》
Document448 pages
《Python大战机器学习：数据科学家的第一个小目标》
劉建廷
No ratings yet
2 崔艳婷千人团队产品制变革之路
Document70 pages
2 崔艳婷千人团队产品制变革之路
RogerZhuo
No ratings yet
基于Pytorch的FCN网络代码实现 PDF
Document23 pages
基于Pytorch的FCN网络代码实现 PDF
刘zw
No ratings yet
FLAC及FLAC3D基础与工程实例
Document448 pages
FLAC及FLAC3D基础与工程实例
lphuong_20
No ratings yet
LCMS GettingStartedGuide
Document64 pages
LCMS GettingStartedGuide
张旭东
No ratings yet
SD
Document9 pages
SD
Lin Phil
No ratings yet
Python培训预备内容
Document63 pages
Python培训预备内容
geyunbo
No ratings yet
RPT TMK 4
Document5 pages
RPT TMK 4
chiongonn kiu
No ratings yet
Machine Learning Python 2017
Document167 pages
Machine Learning Python 2017
Vanitha rao
No ratings yet
基于BiLSTM模型的漏洞检测
Document6 pages
基于BiLSTM模型的漏洞检测
zihan.thops
No ratings yet
专家系统发展综述张煜东
Document5 pages
专家系统发展综述张煜东
Zhuan Yang
No ratings yet
2 张鹏以二进制为中心的CICD和安全
Document34 pages
2 张鹏以二进制为中心的CICD和安全
RogerZhuo
No ratings yet
解决二次分配问题
Document11 pages
解决二次分配问题
afmohkjbg
100% (1)
003 第1篇第01章：知识体系概述 1讲基本概念
Document18 pages
003 第1篇第01章：知识体系概述 1讲基本概念
瞿加辉
No ratings yet
MATLAB基础与应用教程
Document256 pages
MATLAB基础与应用教程
王培淋
No ratings yet
MLX90640开发笔记（第1 10篇） PDF
Document29 pages
MLX90640开发笔记（第1 10篇） PDF
Le G
No ratings yet
Csignal A4
Document26 pages
Csignal A4
yjlee123
No ratings yet
软件工程
Document193 pages
软件工程
Moh Abd Ben
No ratings yet
嵌入式Linux驅動程序和系統開發精講
Document491 pages
嵌入式Linux驅動程序和系統開發精講
James Huang
No ratings yet
Rayplus Intro
Document35 pages
Rayplus Intro
tituandreescu6810
No ratings yet
基于解耦图神经网络的可解释标签感知推荐算法
Document16 pages
基于解耦图神经网络的可解释标签感知推荐算法
Russell Deng
No ratings yet
可部署的量化感知训练算法研究-商汤科技见习研究员李雨杭智东西公开课
Document35 pages
可部署的量化感知训练算法研究-商汤科技见习研究员李雨杭智东西公开课
jiahao li
No ratings yet
可部署的量化感知训练算法研究-商汤科技见习研究员李雨杭智东西公开课
Document35 pages
可部署的量化感知训练算法研究-商汤科技见习研究员李雨杭智东西公开课
jiahao li
No ratings yet
Java 8实战 PDF
Document359 pages
Java 8实战 PDF
杨舒宁
No ratings yet
MSC Project 2701513l
Document33 pages
MSC Project 2701513l
yuhao sun
No ratings yet
YOLOv5在图像识别中的应用
Document5 pages
YOLOv5在图像识别中的应用
RUNSHENG WANG
No ratings yet
Python编程导论（第2版）
Document346 pages
Python编程导论（第2版）
zhao feng
No ratings yet
《物联网开放平台-平台架构、关键技术与典型应用》丁飞
Document277 pages
《物联网开放平台-平台架构、关键技术与典型应用》丁飞
tinymlcorp
No ratings yet
Tracepro入门与进阶
Document140 pages
Tracepro入门与进阶
laserstation
No ratings yet
软件需求总评审展示
Document76 pages
软件需求总评审展示
lishuai1199go
No ratings yet
需求規格書撰寫指引
Document10 pages
需求規格書撰寫指引
WuSc
No ratings yet
61850模型及报文分析
Document40 pages
61850模型及报文分析
lee dong
No ratings yet
华为CodePecker使用手册
Document68 pages
华为CodePecker使用手册
long wang
No ratings yet
离线量化算法研究-商汤科技高级研究员龚睿昊智东西公开课
Document40 pages
离线量化算法研究-商汤科技高级研究员龚睿昊智东西公开课
jiahao li
No ratings yet
【《TensorFlow深度学习》】
Document404 pages
【《TensorFlow深度学习》】
SmallHHH
No ratings yet
Mitre Att&Ck实践入门
Document1 page
Mitre Att&Ck实践入门
minglai
No ratings yet
TensorFlow深度学习（带目录）
Document404 pages
TensorFlow深度学习（带目录）
杨奕航
No ratings yet
92 Project Presentation
Document11 pages
92 Project Presentation
udl75088
No ratings yet
VLSI 物理设计。从图形分割到时序闭合
Document161 pages
VLSI 物理设计。从图形分割到时序闭合
马英九
No ratings yet
第1章 matlab基础入门
Document122 pages
第1章 matlab基础入门
Ralf Reinhart
No ratings yet
D8 软件开发安全
Document50 pages
D8 软件开发安全
Kevin Huang
No ratings yet
Hi3516DV300 SDK
Document20 pages
Hi3516DV300 SDK
jbs
No ratings yet
LEAD测井综合应用平台用户手册
Document398 pages
LEAD测井综合应用平台用户手册
NI
No ratings yet
Asip Designer Ds CN
Document6 pages
Asip Designer Ds CN
魏震榮
No ratings yet
五分钟学大数据大数据面试吹牛草稿v2.0(面试必备)
Document22 pages
五分钟学大数据大数据面试吹牛草稿v2.0(面试必备)
aarronnlp
No ratings yet
Ch12345Homework 20210219xg
Document5 pages
Ch12345Homework 20210219xg
Amy
No ratings yet
Untitled
Document23 pages
Untitled
苗天宇
No ratings yet
Tapestry开发指南0 9
Document116 pages
Tapestry开发指南0 9
fghghjyee
No ratings yet
1 6小米在知识表示学习方向的探索与实践
Document27 pages
1 6小米在知识表示学习方向的探索与实践
JIA zheng
No ratings yet
基于NLP神经网络的软件漏洞自动分类方法研究
Document70 pages
基于NLP神经网络的软件漏洞自动分类方法研究
zihan.thops
No ratings yet
13485-2016 Internal Auditor Training
Document181 pages
13485-2016 Internal Auditor Training
zhibinup
No ratings yet
"康乾盛世"真的存在吗 - 基于经济数据测算的分析李强
Document10 pages
"康乾盛世"真的存在吗 - 基于经济数据测算的分析李强
Kee Hap Leng IPGKTB
No ratings yet
Beej-Cn-20140429 2
Document170 pages
Beej-Cn-20140429 2
knkn kn
No ratings yet
「回家的鹿上」繪本創作
Document26 pages
「回家的鹿上」繪本創作
1104205049 馬書晨
No ratings yet