Welcome to Scribd!

Adaptive Estimator Selection For Off-Policy Evaluation

Uploaded by

0% found this document useful (0 votes)

11 views1 page

Adaptive Estimator Selection for Off-Policy Evaluation presents a generic data-driven method for selecting estimators in off-policy policy evaluation. The method establishes strong performance guarantees, showing it is competitive with the optimal estimator up to a constant factor. Case studies demonstrate the method's generality in contextual bandits and reinforcement learning. Extensive experiments show the empirical efficacy of the approach compared to related methods.

Original Description:

icml 5

Original Title

Paper-5

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

11 views1 page

Adaptive Estimator Selection For Off-Policy Evaluation

Uploaded by

Thomas Lee

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

8/19/2020 Paper

Adaptive Estimator Selection for Off-Policy Evaluation

Part of Proceedings of the International Conference on Machine Learning 119 pre-proceedings (ICML 2020)
Bibtex » Metadata » Paper » Supplemental »

Authors
Yi Su, Pavithra Srinath, Akshay Krishnamurthy
Abstract
We develop a generic data-driven method for estimator selection in off-policy policy evaluation settings. We establish a strong
performance guarantee for the method, showing that it is competitive with the oracle estimator, up to a constant factor. Via in-depth
case studies in contextual bandits and reinforcement learning, we demonstrate the generality and applicability of the method. We also
perform comprehensive experiments, demonstrating the empirical efficacy of our approach and comparing with related approaches. In
both case studies, our method compares favorably with existing methods.

This website is beta: Report an Issue »

https://proceedings.icml.cc/book/2020/hash/074177d3eb6371e32c16c55a3b8f706b 1/1

The Piccolo Study Book - Morris, Patricia - 9780853608523 - Amazon - Com - Books PDF
Document1 page
The Piccolo Study Book - Morris, Patricia - 9780853608523 - Amazon - Com - Books PDF
Thomas Lee
No ratings yet
Implementing the Stakeholder Based Goal-Question-Metric (Gqm) Measurement Model for Software Projects
From Everand
Implementing the Stakeholder Based Goal-Question-Metric (Gqm) Measurement Model for Software Projects
Dr. Prashanth Harish Southekal
No ratings yet
Movie Recommendation System Using TF-IDF Vectorization and Cosine Similarity
Document9 pages
Movie Recommendation System Using TF-IDF Vectorization and Cosine Similarity
IJRASETPublications
No ratings yet
5-A Novel Multi-Objective Evolutionary Algorithm For Recommendation Systems
Document11 pages
5-A Novel Multi-Objective Evolutionary Algorithm For Recommendation Systems
Muhammad Junaid Ali
No ratings yet
JMU School of Music Playing The Piccolo WITH CONFIDENCE!
Document2 pages
JMU School of Music Playing The Piccolo WITH CONFIDENCE!
Thomas Lee
No ratings yet
Building A Movie Recommendation System Using Collaborative Filtering With TF-IDF-IJRASET
Document13 pages
Building A Movie Recommendation System Using Collaborative Filtering With TF-IDF-IJRASET
IJRASETPublications
No ratings yet
A Direct Data-Cluster Analysis Method Based On Neutrosophic Set Implication
Document18 pages
A Direct Data-Cluster Analysis Method Based On Neutrosophic Set Implication
Science Direct
No ratings yet
Adaptive Estimator Selection For Off-Policy Evaluation
Document1 page
Adaptive Estimator Selection For Off-Policy Evaluation
Thomas Lee
No ratings yet
Counterfactual Risk Assesment
Document12 pages
Counterfactual Risk Assesment
sgalexmun17
No ratings yet
MediaRec A Hybrid Media Recommender System
Document8 pages
MediaRec A Hybrid Media Recommender System
IJRASETPublications
No ratings yet
RP 1
Document11 pages
RP 1
anonymous45
No ratings yet
3 0 Lueckmann21a
Document14 pages
3 0 Lueckmann21a
Mulang' Onando
No ratings yet
Implementation of Preference Selection Index (PSI) Method in The System of Support The Decision of The Selectionof Exemplary Nurses
Document8 pages
Implementation of Preference Selection Index (PSI) Method in The System of Support The Decision of The Selectionof Exemplary Nurses
zhafirah rahmadini
No ratings yet
Credit Risk Analysis Using Naive Bayes in Machine Learning
Document5 pages
Credit Risk Analysis Using Naive Bayes in Machine Learning
IJRASETPublications
No ratings yet
Audit Risk Assesment
Document16 pages
Audit Risk Assesment
Rini Sartini
No ratings yet
Prediction Analysis Techniques of Data M
Document8 pages
Prediction Analysis Techniques of Data M
NavAhmed
No ratings yet
Logistics: Supplier Selection Risk: A New Computer-Based Decision-Making System With Fuzzy Extended AHP
Document17 pages
Logistics: Supplier Selection Risk: A New Computer-Based Decision-Making System With Fuzzy Extended AHP
Eka Octavian Pranata
No ratings yet
Predictive Analytics Using Big Data: A Survey
Document8 pages
Predictive Analytics Using Big Data: A Survey
BESTJournals
No ratings yet
Statistical Inference For Online Decision-Making: in A Contextual Bandit Setting
Document44 pages
Statistical Inference For Online Decision-Making: in A Contextual Bandit Setting
Mohammad Tabatabaei
No ratings yet
Rfs/hhaa 009
Document49 pages
Rfs/hhaa 009
Apple Park
No ratings yet
Empirical Asset Pricing Via Machine Learning
Document51 pages
Empirical Asset Pricing Via Machine Learning
chance
No ratings yet
Synopsis - CDP - Prajwalprabhu - Finalff
Document7 pages
Synopsis - CDP - Prajwalprabhu - Finalff
Prajwal Prabhu
No ratings yet
Credit Rating by Hybrid 4 Tekniği Vermiş PDF
Document7 pages
Credit Rating by Hybrid 4 Tekniği Vermiş PDF
Eda Çevik
No ratings yet
An Improved Hybrid Feature Selection Method For Huge Dimensional Datasets
Document10 pages
An Improved Hybrid Feature Selection Method For Huge Dimensional Datasets
IAES IJAI
No ratings yet
Increasing Prediction Accuracy in Collaborative Filtering With Initialized Factor Matrices
Document16 pages
Increasing Prediction Accuracy in Collaborative Filtering With Initialized Factor Matrices
vinodha
No ratings yet
Sackett Et Al - 2022 - Revisiting Meta-Analytic Estimates of Validity in Personnel Selection
Document105 pages
Sackett Et Al - 2022 - Revisiting Meta-Analytic Estimates of Validity in Personnel Selection
ronaldohujian1111
No ratings yet
Physica A: Feng Shen, Xingchao Zhao, Zhiyong Li, Ke Li, Zhiyi Meng
Document17 pages
Physica A: Feng Shen, Xingchao Zhao, Zhiyong Li, Ke Li, Zhiyi Meng
Jorge Luis Soriano
No ratings yet
Home-Credit Risk Analysis and Prediction Modelling Using Python
Document12 pages
Home-Credit Risk Analysis and Prediction Modelling Using Python
IJRASETPublications
No ratings yet
A Multi-Objective Artificial Bee Colony Approach For Profit-Aware Recommender Systems
Document13 pages
A Multi-Objective Artificial Bee Colony Approach For Profit-Aware Recommender Systems
Jai Jindal
No ratings yet
10471-Article Text-2785-3-10-20200706
Document7 pages
10471-Article Text-2785-3-10-20200706
damsel fly
No ratings yet
The Center For Causal
Document5 pages
The Center For Causal
detki007
No ratings yet
Data Quality Evaluation Using Probability Models: 1 Research Problem 2 Outline of Objectives
Document6 pages
Data Quality Evaluation Using Probability Models: 1 Research Problem 2 Outline of Objectives
uday phalak
No ratings yet
Empirical Asset Pricing Via Machine Learning
Document78 pages
Empirical Asset Pricing Via Machine Learning
Patrick Ribeiro Maia
No ratings yet
Optimizing Positional Scoring Rules For Rank Aggregation
Document20 pages
Optimizing Positional Scoring Rules For Rank Aggregation
Sabahat Hussain
No ratings yet
ML PDF
Document7 pages
ML PDF
manchal2204
No ratings yet
Predicting Property Prices With Machine Learning Algorithms: Journal of Property Research
Document24 pages
Predicting Property Prices With Machine Learning Algorithms: Journal of Property Research
Terrence Dahoe
No ratings yet
Hyperband
Document52 pages
Hyperband
Cesar Guzman
No ratings yet
Information Sciences: Suyeon Yoo, Sungjin Kim, Seungjae Kim, Brent Byunghoon Kang
Document16 pages
Information Sciences: Suyeon Yoo, Sungjin Kim, Seungjae Kim, Brent Byunghoon Kang
Rahmat Febriansyah
No ratings yet
Customer Churn Prediction in Banking Sector - A Hybrid Approach
Document6 pages
Customer Churn Prediction in Banking Sector - A Hybrid Approach
IJRASETPublications
No ratings yet
A Support Vector Machine For Model Selection in Demand Forecasting Applications PDF
Document7 pages
A Support Vector Machine For Model Selection in Demand Forecasting Applications PDF
Vỹ Phạm
No ratings yet
Recommendation System On Cloud Environment A Descriptive Study On This Marketing Strategy
Document10 pages
Recommendation System On Cloud Environment A Descriptive Study On This Marketing Strategy
IJRASETPublications
No ratings yet
ANNOTATED Machine Learning
Document6 pages
ANNOTATED Machine Learning
sanith 7
No ratings yet
Recommender Treatment
Document10 pages
Recommender Treatment
mg199224
No ratings yet
Prisma Flow Chart Literature Review
Document8 pages
Prisma Flow Chart Literature Review
wclochxgf
100% (1)
Intellihealth
Document16 pages
Intellihealth
Usman Qamar
No ratings yet
Credit Risk Models For Financial
Document20 pages
Credit Risk Models For Financial
erwisme
No ratings yet
1712 04802
Document81 pages
1712 04802
Paulo Vitor Antonacci Moura
No ratings yet
Expert Systems - 2018 - Gici - Credit Scoring For A Microcredit Data Set Using The Synthetic Minority Oversampling
Document22 pages
Expert Systems - 2018 - Gici - Credit Scoring For A Microcredit Data Set Using The Synthetic Minority Oversampling
erwisme
No ratings yet
Kelly Empirical AP PDF
Document80 pages
Kelly Empirical AP PDF
Benjamin Myara
No ratings yet
A Machine Learning Based Method For Customer Behavior Prediction
Document7 pages
A Machine Learning Based Method For Customer Behavior Prediction
vynska amalia
No ratings yet
08 2020 RFS Empirical Asset Pricing Via Machine Learning
Document79 pages
08 2020 RFS Empirical Asset Pricing Via Machine Learning
林欣儒
No ratings yet
ITE2013 Big Data Analytics
Document13 pages
ITE2013 Big Data Analytics
SUKANT JHA 19BIT0359
No ratings yet
Vol 11 3
Document5 pages
Vol 11 3
bhuvanesh.cse23
No ratings yet
Optimizing Fraudulent Firm Prediction Using Ensemble Machine Learning A Case Study of An External Audit
Document12 pages
Optimizing Fraudulent Firm Prediction Using Ensemble Machine Learning A Case Study of An External Audit
GMCP
No ratings yet
Literature Review Data Extraction Tool
Document4 pages
Literature Review Data Extraction Tool
afdtalblw
100% (1)
DC Meet Second
Document21 pages
DC Meet Second
Anonymous TxPyX8c
No ratings yet
The Prediction of Disease Using Machine Learning: December 2021
Document8 pages
The Prediction of Disease Using Machine Learning: December 2021
Sudhi Suresh
No ratings yet
E-Learning System Literature Review
Document8 pages
E-Learning System Literature Review
cjxfjjvkg
100% (1)
Information Processing and Management: Sciencedirect
Document16 pages
Information Processing and Management: Sciencedirect
MichaelLevy
No ratings yet
98 Jicr September 3208
Document6 pages
98 Jicr September 3208
STRANGER MAN
No ratings yet
An Application of Machine Learning in Ivf Comparing The Accuracy of Classification Alogithims For The Prediction of Twin
Document5 pages
An Application of Machine Learning in Ivf Comparing The Accuracy of Classification Alogithims For The Prediction of Twin
Rajee
No ratings yet
Sentiment Analysis and Review Classification Using Deep Learning
Document8 pages
Sentiment Analysis and Review Classification Using Deep Learning
IJRASETPublications
No ratings yet
Adaptive Sampling For Estimating Probability Distributions
Document1 page
Adaptive Sampling For Estimating Probability Distributions
Thomas Lee
No ratings yet
Fast Learning of Graph Neural Networks With Guaranteed Generalizability: One-Hidden-Layer Case
Document1 page
Fast Learning of Graph Neural Networks With Guaranteed Generalizability: One-Hidden-Layer Case
Thomas Lee
No ratings yet
Abstraction Mechanisms Predict Generalization in Deep Neural Networks
Document1 page
Abstraction Mechanisms Predict Generalization in Deep Neural Networks
Thomas Lee
No ratings yet
Paper 1 PDF
Document1 page
Paper 1 PDF
Thomas Lee
No ratings yet