0

당신이 알지 못하는 경우에, 적대적인 이미지는 특정 클래스에 속하지만 시각적으로 육안으로는 인식 할 수없는 왜곡이있는 이미지이지만 네트워크는 그것을 잘못 인식합니다 완전히 다른 학급에서. 여기에 대한기계 학습 (Adversarial Images)

더 많은 정보 : TensorFlow를 사용 http://karpathy.github.io/2015/03/30/breaking-convnets/

, 나는 길쌈 신경망에 대해 많은 것을 배웠습니다.

def weight_variable(shape): 
    initial = tf.truncated_normal(shape, stddev=0.1) 
    return tf.Variable(initial) 

def bias_variable(shape): 
    initial = tf.constant(0.1, shape=shape) 
    return tf.Variable(initial) 

def conv2d(x, W): 
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME') 

def max_pool_2x2(x): 
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], 
         strides=[1, 2, 2, 1], padding='SAME') 

W_conv1 = weight_variable([5, 5, 1, 32]) 
b_conv1 = bias_variable([32]) 

x_image = tf.reshape(x, [-1,28,28,1]) 

h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1) 
h_pool1 = max_pool_2x2(h_conv1) 


W_conv2 = weight_variable([5, 5, 32, 64]) 
b_conv2 = bias_variable([64]) 

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) 
h_pool2 = max_pool_2x2(h_conv2) 


W_fc1 = weight_variable([7 * 7 * 64, 1024]) 
b_fc1 = bias_variable([1024]) 

h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64]) 
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1) 

keep_prob = tf.placeholder(tf.float32) 
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob) 


W_fc2 = weight_variable([1024, 10]) 
b_fc2 = bias_variable([10]) 

y_conv = tf.matmul(h_fc1_drop, W_fc2) + b_fc2 

과제는 입력으로도 "2"로 표시된 숫자 2의 이미지이며, 출력은 '6'으로 식별 할 수 있도록 어떻게 든 차이만큼 약간의 픽셀을 변경 이미지를 컨벌루션 인식 할 수 없다.

누구나 어디서부터 시작해야할까요?

+0

적개심의 예를 생성하는 방법을 언급 한 논문을 실제로 읽어야합니다. –

답변

1
당신은이 문서를 읽어 시작할 수 있습니다

: https://arxiv.org/abs/1412.6572 (예를 들어)

그것은 입력에 대한 손실 함수의 기울기를 계산하여 적대 예를 생성 할 수있는 방법 중 하나를 설명합니다.

grads = tf.gradients(loss, [x])[0] 
signs = tf.sign(grads) 
epsilon = tf.constant(0.25) 
x_adversarial = tf.add(tf.multiply(epsilon, signs), x) 

x_adversarial이 비열한 이미지가 될 것입니다 : 당신은 예를 들어 크로스 엔트로피에 대한 당신의 손실 함수를 정의하면

tf.gradients()

에서보세요, 당신이 그런 짓을. 추가 된 노이즈의 크기를 설정하는 epsilon 값으로 재생할 수 있습니다.