Generating Counterfactual Examples through Generating Adversarial Examples

Hyungyu Lee; Dahuin Jung

doi:10.5626/jok.2022.49.12.1132

ScienceGate Book Chapters

JOURNAL ARTICLE

Generating Counterfactual Examples through Generating Adversarial Examples

Hyungyu Lee Dahuin Jung

Year: 2022 Journal: Journal of KIISE Vol: 49 (12)Pages: 1132-1142 Publisher: Korea Information Science Society

DOI: 10.5626/jok.2022.49.12.1132

Get Full-Text PDF Get Analytical Report

Abstract

인공지능 기술은 많은 편의를 가져다주었지만, 인공지능 모델의 복잡한 구조는 그 작동 원리를 이해하기 어렵게 만들었다. 반사실적 설명은 인공지능을 설명하는 방법으로, 인간이 인지할 수 있는 최소한의 변화가 반영되어 분류 결과를 바꾸는 반사실적 예제를 통해 설명한다. 적대적 예제는 인공지능 모델의 분류 결과를 바꿀 목적으로 변형된 데이터이며, 반사실적 예제와 다르게 반영된 변화를 인간이 인지하기 어렵다. 단순한 모델에서는 적대적 예제가 반사실적 예제처럼 생성될 수 있지만, 딥러닝 모델에서는 인간과 인공지능의 인지 차이가 크기 때문에 어렵다. 하지만, 우리는 일부 딥러닝 모델에서 생성된 적대적 예제가 반사실적 예제처럼 생성되는 것을 확인하였다. 본 논문에서, 우리는 적대적 예제가 반사실적 예제처럼 생성되는 딥러닝 모델의 모델 구조와 조건들을 분석한다. 우리는 부분 집중 변화도 메트릭을 제안하고 기존의 메트릭과 함께 활용해 서로 다른 모델에서 생성되는 적대적 예제를 비교해본다.

Keywords:

Counterfactual thinking Adversarial system Computer science Artificial intelligence Management science Epistemology Economics Philosophy

Metrics

Cited By

0.00

FWCI (Field Weighted Citation Impact)

Refs

0.27

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Topics

Technology and Data Analysis

Physical Sciences → Computer Science → Information Systems

Advanced Decision-Making Techniques

Physical Sciences → Computer Science → Information Systems

Generating Counterfactual Examples through Generating Adversarial Examples

Abstract

Metrics

Topics

Related Documents

Generating Adversarial Examples with Adversarial Networks

Generating Watermarked Speech Adversarial Examples

Generating Adversarial Examples Using LAD

Generating Natural Language Adversarial Examples

Generating Adversarial Examples by Distributed Upsampling