Open navigation menu

Welcome to Scribd!

LLMs

Uploaded by

0% found this document useful (0 votes)

4 views40 pages

Copyright

© © All Rights Reserved

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

© All Rights Reserved

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views40 pages

LLMs

Uploaded by

Copyright:

© All Rights Reserved

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 40

Search inside document

Large Language Models and

Applications
GPT-4 just
released!
GPT-4 just released!
GPT-4 just released!
Model size is increasing exponentially
1. Behind LLMs: Language Models
Theories of Language Models
Three approaches for language modelling

· Sentence Correction (Denoising)

· Text Completion

· Text Translation

7
Theories of Language Models
Parametric architectures for sentence denoising: Encoder

8
Theories of Language Models
Parametric architectures for text completion: Decoder

9
Theories of Language Models
Parametric architectures for text translation: Encoder-Decoder

10
Theories of Language Models
Training Language Models

· Pre-training

· Supervised Training

· Reinforcement Learning

11
2. More is Different, Language Models Likewise

12
LLM is different: A paradigm shift
• Harder to handle: Training cost

13
LLM is different: A paradigm shift
• Easier to use: From fine-tuning to prompt engineering

14
LLM is different: A paradigm shift
• Emerging Capabilities: ICL / CoT / MM reasoning

15
LLM is different: A paradigm shift
• Solving real-word problems with general intelligence

16
LLM is different: A paradigm shift
• Solving real-word problems with general intelligence

17
3. Examples and applications of LLMs

18
ChatGPT: Reinforcement Learning from Human Feedback

19
Kosmos-1: Multimodal Large Language Models

20
PaLM-E: Embodied Language Models

21
Visual ChatGPT: Large Language Model + Visual Models

22
Galactica: Language Model + Research Data

23
Applications

24
Applications
• Education

• Customer service / advisor

• Knowledge Management

• Recommendation

• Virtual Assistant

25
4. Future Research Directions about LLMs

26
“Replicating” LLMs
Approaches: Improving Effectiveness

• Curating training corpus

• Human Evaluation for Ethics

• Learning from existing LMs

27
Alpaca: Learning from existing LLMs

28
“Replicating” LLMs
Approaches: Improving Efficiency

• Training: Efficient / Staged Training

• Hardware: GPU / Cloud / Federate Learning

• Software: Compiling / Coding

29
“Replicating” LLMs
Pros:

• Encourages open-source

• Business security

• Customizable for specific use

30
“Replicating” LLMs
Cons:

• Expensive with risks

• Ethical considerations

• Limited data availability

31
“Leveraging” LLMs
Approaches: borrowing wisdom from LLMs

• In-Context Learning

• Knowledge Distillation

• Systems with LLMs

• Prompt Engineering

32
MathPrompter: Prompt LM and verify result

33
“Leveraging” LLMs
Pros:

• Easy to start

• Relatively low cost

Cons:

• Competitiveness

• Performance variance
34
“Replacing” LLMs
Approaches:

• Augmented Language Models

• New Architecture for Language Models

Pros & cons:

• high risk & high reward

35
Augmented Language Models: Toolformer

36
New Architecture for Language Models: AFT

37
5. Summary

38
A new
Moore’s Law
is coming!

39
Thanks!
Email: wangzihan0527@ruc.edu.cn
Homepage: zihanwang314.github.io

40

You might also like

AIML Online
Document16 pages
AIML Online
MAHESHUMANATH GOPALAKRISHNAN
No ratings yet
Fractional Calculus - Applications
Document306 pages
Fractional Calculus - Applications
John Alain Stanley Viraca Vega
100% (1)
Lecture 1&2 PPL
Document58 pages
Lecture 1&2 PPL
Kids break free world
No ratings yet
Boom Placer Checklist
Document3 pages
Boom Placer Checklist
Alves Edattukaran
100% (3)
Io List
Document4 pages
Io List
sswahyudi
No ratings yet
Lecture 2 Design Principal
Document49 pages
Lecture 2 Design Principal
farah shahbaz
No ratings yet
Overview of OOMD
Document57 pages
Overview of OOMD
Pooja Yadav
No ratings yet
PED Technip PDF
Document22 pages
PED Technip PDF
savan
100% (1)
Current Best Practices For Training LLMs From Scratch - Final
Document23 pages
Current Best Practices For Training LLMs From Scratch - Final
Hasala Marakkalage
No ratings yet
Building Finetuning Aimodels
Document41 pages
Building Finetuning Aimodels
malaysheth34
No ratings yet
Large Language Model
Document38 pages
Large Language Model
21020641
No ratings yet
Lec 03
Document91 pages
Lec 03
Ghhanali Singh
No ratings yet
Generative AI Roadmap
Document36 pages
Generative AI Roadmap
Rushi Khandare
No ratings yet
NLP DL Lecture4
Document78 pages
NLP DL Lecture4
thanh.tien.96.vn
No ratings yet
Lecture HPC 7 Programming Paradigms
Document21 pages
Lecture HPC 7 Programming Paradigms
Majier Makeer
No ratings yet
04 Programming & It's Preparation
Document39 pages
04 Programming & It's Preparation
Abdul Muqsit Rawasia
No ratings yet
Programming Paradigms: (Lectures On High-Performance Computing For Economists VII)
Document21 pages
Programming Paradigms: (Lectures On High-Performance Computing For Economists VII)
Aurang Zeb
No ratings yet
01 Intro
Document51 pages
01 Intro
De Revelators Acapella
No ratings yet
Introduction To Programming Languages and Compilation
Document49 pages
Introduction To Programming Languages and Compilation
mmed68003
No ratings yet
L01 - 30.01.2018 - Basics of Structured Programming
Document28 pages
L01 - 30.01.2018 - Basics of Structured Programming
Mohammad Anisur Rahaman
No ratings yet
adaptMLLM Fine-Tuning Multilingual Language Models
Document24 pages
adaptMLLM Fine-Tuning Multilingual Language Models
tor.z.lib.99
No ratings yet
An Empirical Assessment of Model-Driven Engineering in Industry
Document45 pages
An Empirical Assessment of Model-Driven Engineering in Industry
api-77477038
No ratings yet
Talk Epitech Nov13
Document54 pages
Talk Epitech Nov13
MD Redwan Islam
No ratings yet
Previous Lecture
Document43 pages
Previous Lecture
muneeb
No ratings yet
Accessible Multimodal/transfer Learning With PyKale
Document29 pages
Accessible Multimodal/transfer Learning With PyKale
Haiping Lu
No ratings yet
Plansformer
Document44 pages
Plansformer
iamsamrajnee
No ratings yet
Enhanced Eudml Content Accessible Layered PDF Eudml 257050 0
Document23 pages
Enhanced Eudml Content Accessible Layered PDF Eudml 257050 0
alejandro florez lesmes
No ratings yet
Lecture 01
Document35 pages
Lecture 01
Akarsh Kusumanchi
No ratings yet
GSC-445 Operations Research
Document3 pages
GSC-445 Operations Research
Selam Abdulbasit
No ratings yet
PPL Notes
Document138 pages
PPL Notes
திரு பிரபு
No ratings yet
Title: Introduction To Latex and Scilab: Eligibility
Document4 pages
Title: Introduction To Latex and Scilab: Eligibility
Vinayak Savarkar
No ratings yet
Lecture 2
Document34 pages
Lecture 2
Syed Sahab Ali Shah
No ratings yet
Object Oriented Programming: Asim Altaf Shah
Document15 pages
Object Oriented Programming: Asim Altaf Shah
arsalan latif
No ratings yet
Compiler Lec1
Document32 pages
Compiler Lec1
yg arabimoghadam
No ratings yet
02-SE Intro
Document60 pages
02-SE Intro
farhan ahmed
No ratings yet
COMP36512 - Compilers Lecture 1: Introduction: - Module Aims
Document12 pages
COMP36512 - Compilers Lecture 1: Introduction: - Module Aims
Aayush Kaushal
No ratings yet
Building LLM Applications For Production
Document28 pages
Building LLM Applications For Production
roshan.U 1GV18ME016
No ratings yet
Writing Bug-Free Code Using Theorem Provers
Document32 pages
Writing Bug-Free Code Using Theorem Provers
Jexia
No ratings yet
Lecture 1 - Overview & Introduction
Document47 pages
Lecture 1 - Overview & Introduction
Muhammad Shayan
No ratings yet
L01 - Basics of Structured Programming
Document35 pages
L01 - Basics of Structured Programming
Mohammad Anisur Rahaman
100% (2)
HL7 +mirth Connect Training Course Curriculam-V3 BY MR - Dickson Trainer From
Document5 pages
HL7 +mirth Connect Training Course Curriculam-V3 BY MR - Dickson Trainer From
afroz01
No ratings yet
MiniCPM-2B: New Compact Multimodal LLM Outperforming The Giants
Document9 pages
MiniCPM-2B: New Compact Multimodal LLM Outperforming The Giants
My Social
No ratings yet
Learning To Retrieve In-Context Examples For Large Language Models
Document16 pages
Learning To Retrieve In-Context Examples For Large Language Models
VKB Library iisu
No ratings yet
MDSE Book Slides Chapter3
Document27 pages
MDSE Book Slides Chapter3
Ibass Iswanto
No ratings yet
Human Factors in Explainability 1 of 2
Document41 pages
Human Factors in Explainability 1 of 2
Paul George
No ratings yet
MLPerf - Vision Behind MLPerf
Document62 pages
MLPerf - Vision Behind MLPerf
Jack Purcher
No ratings yet
A Practical Guide Using LLMs ChatGPT and Beyond
Document24 pages
A Practical Guide Using LLMs ChatGPT and Beyond
wz497345846
No ratings yet
CH 1
Document32 pages
CH 1
Mahir Abir
No ratings yet
L01 - Introduction
Document51 pages
L01 - Introduction
Bigu Marius Alin
No ratings yet
LLM Aiml
Document2 pages
LLM Aiml
powerites009
No ratings yet
AI.5 Machine Learning (21 26)
Document176 pages
AI.5 Machine Learning (21 26)
ncqphuong.20it2
No ratings yet
Aiml Online Brochure
Document16 pages
Aiml Online Brochure
Karthik
No ratings yet
MPCS 51240: Product Management: October 20, 2021
Document42 pages
MPCS 51240: Product Management: October 20, 2021
Jin Li
No ratings yet
DSCI565 Paper Presentation - Group 3
Document24 pages
DSCI565 Paper Presentation - Group 3
Vishwas Tanwar
No ratings yet
HL7 +mirth Connect Training Course Curriculum
Document6 pages
HL7 +mirth Connect Training Course Curriculum
HL7 Training Tutorials
No ratings yet
PL 11 CH 1
Document31 pages
PL 11 CH 1
Mert Pinarbasi
No ratings yet
Impediments To Widespread Adoption of Functional Languages
Document25 pages
Impediments To Widespread Adoption of Functional Languages
noelwelsh
No ratings yet
Simplifying The Teaching of Computer Programming
Document11 pages
Simplifying The Teaching of Computer Programming
jokoga7495
No ratings yet
Optimization and Linear Programing-LingoFundamentals
Document32 pages
Optimization and Linear Programing-LingoFundamentals
jorollig-1
100% (1)
Concepts in Programming Languages: Alan Mycroft
Document266 pages
Concepts in Programming Languages: Alan Mycroft
Ashesh Krishna Adhikari
No ratings yet
Object Oriented Programming: Learning & Knowledge Education - India
Document86 pages
Object Oriented Programming: Learning & Knowledge Education - India
swethaTMR
No ratings yet
0 Intro Fall 2021 3
Document22 pages
0 Intro Fall 2021 3
eesterically
No ratings yet
Using Design Patterns in Real Projects
Document26 pages
Using Design Patterns in Real Projects
tcab22
100% (3)
Demystifying Large Language Models: Unraveling the Mysteries of Language Transformer Models, Build from Ground up, Pre-train, Fine-tune and Deployment
From Everand
Demystifying Large Language Models: Unraveling the Mysteries of Language Transformer Models, Build from Ground up, Pre-train, Fine-tune and Deployment
James Chen
No ratings yet
Off-Line Handwritten Signature Recognition Based On Genetic Algorithm and Euclidean Distance
Document12 pages
Off-Line Handwritten Signature Recognition Based On Genetic Algorithm and Euclidean Distance
IAES IJAI
No ratings yet
Semi-Automatic Band Saws: Sawing With Highest Precision, Where Others Meet Their Limits!
Document3 pages
Semi-Automatic Band Saws: Sawing With Highest Precision, Where Others Meet Their Limits!
Kali Abdennour
No ratings yet
Different Types of Technology Used in The Industry
Document5 pages
Different Types of Technology Used in The Industry
Allan Agpalo
No ratings yet
City of New Boston V Netflix
Document12 pages
City of New Boston V Netflix
THROnline
No ratings yet
Boot Magazine - Issue 04 - Lust List 96 - December 1996
Document124 pages
Boot Magazine - Issue 04 - Lust List 96 - December 1996
José Arce
No ratings yet
Scheme of Examination
Document42 pages
Scheme of Examination
pkdhabra
No ratings yet
File 4
Document5 pages
File 4
Sri Neha
No ratings yet
PC - Print - 11-15-24 Am
Document4 pages
PC - Print - 11-15-24 Am
Theo Anggara
No ratings yet
Briefing-Note-9---Soft-Landings
Document6 pages
Briefing-Note-9---Soft-Landings
IDEAL DRAGONS
No ratings yet
Review On Compressive Sensing Algorithms For ECG Signal
Document37 pages
Review On Compressive Sensing Algorithms For ECG Signal
Hongqing Yu
No ratings yet
PGDEPA Announcement 2021-22
Document4 pages
PGDEPA Announcement 2021-22
Raju
No ratings yet
Unit 9 Plate and Press Problems: Task 1 Read The Text and Then Answer The Questions
Document19 pages
Unit 9 Plate and Press Problems: Task 1 Read The Text and Then Answer The Questions
Lieu Dang
No ratings yet
KWL Chart
Document3 pages
KWL Chart
Lrac Sirad Trinidad
No ratings yet
Oriental College of Technology Bhopal: Major Project Synopsis
Document4 pages
Oriental College of Technology Bhopal: Major Project Synopsis
KrishnaBihariShukla
No ratings yet
Sample of Detailed Lesson Plan Grade 3
Document4 pages
Sample of Detailed Lesson Plan Grade 3
Godwin Babaran
No ratings yet
Delhi Public School Agra: Matrix Math Olympiad: 2022-23 Practice Worksheet 1 Class - XI
Document2 pages
Delhi Public School Agra: Matrix Math Olympiad: 2022-23 Practice Worksheet 1 Class - XI
Divyanshu Yadav
No ratings yet
Powerbuilder Accelerating Soa Development - Part Ii: White Paper
Document12 pages
Powerbuilder Accelerating Soa Development - Part Ii: White Paper
Cristian Fernando Galarza Galarza
No ratings yet
Apply For Ethiopian Passport Online1
Document1 page
Apply For Ethiopian Passport Online1
efokimem
100% (1)
PCS-221S X Communication+Protocol+Manual EN Overseas+General X R1.00
Document95 pages
PCS-221S X Communication+Protocol+Manual EN Overseas+General X R1.00
Shigue París Wagata
No ratings yet
Sri Mittapalli College of Engineering
Document41 pages
Sri Mittapalli College of Engineering
brsreddy
No ratings yet
The Ordered Bell Numbers As Weighted Sums of Odd or Even Stirling Numbers of The Second Kind
Document3 pages
The Ordered Bell Numbers As Weighted Sums of Odd or Even Stirling Numbers of The Second Kind
FRANK BULA MARTINEZ
No ratings yet
3 GET + FET Curriculum Coverage July 2019
Document356 pages
3 GET + FET Curriculum Coverage July 2019
trace
No ratings yet
Stotram Digitalized by
Document3 pages
Stotram Digitalized by
manchiraju raj kumar
No ratings yet
Function Overloading and Overriding in C++: March 22, 2013
Document31 pages
Function Overloading and Overriding in C++: March 22, 2013
prajari ghosh
No ratings yet
Android Syllabus
Document2 pages
Android Syllabus
Anonymous QIuAGIadXm
No ratings yet
User Enrolment Form V2
Document2 pages
User Enrolment Form V2
Barangay Basdiot
No ratings yet