2017년 5월 7일 일요일

(TF 1.1 & Slim) 2.2 딥러닝 모델 학습하기

댓글 20개:

Unknown2017년 5월 7일 오후 11:05
안녕하세요. 수정해서 올려주신 tf 1.1용 포스트덕분에 2.1절 flower 영상 변환까지는 성공하였습니다. 그런데, 2.2절에서 dataset_utils.py 파일 128번 라인을 수정하고,python train_image_classifier.py --train_dir=\tmp\train_inception_v1_flowers_logs --dataset_name=flowers --dataset_split_name=train --dataset_dir=\tmp\flowers --batch_size=16 --model_name=inception_v1을 실행하면 tensorflow:Error reported to Coordinator: a bytes-like object is required, not 'str' 에러가 납니다. 뭐가 잘못된걸가요? 미리 감사드립니다.
답글삭제
답글
익명2017년 5월 16일 오후 3:55
안녕하세요, 위에 올려주신 내용에 대해서 학습 진행중인데요. 오류가 나는 부분이 있는데 혹시나 하는 마음에 문의드립니다.

(C:\Anaconda3) c:\utils\models-master\slim>python train_image_classifier.py --train_dir=\tmp\train_inception_v1_flowers_logs --dataset_name=flowers --dataset_split_name=train --dataset_dir=\tmp\flowers --batch_size=16 --model_name=inception_v1
Traceback (most recent call last):
File "train_image_classifier.py", line 573, in
tf.app.run()
File "C:\Anaconda3\lib\site-packages\tensorflow\python\platform\app.py", line 43, in run
sys.exit(main(sys.argv[:1] + flags_passthrough))
File "train_image_classifier.py", line 472, in main
clones = model_deploy.create_clones(deploy_config, clone_fn, [batch_queue])
File "c:\utils\models-master\slim\deployment\model_deploy.py", line 195, in create_clones
outputs = model_fn(*args, **kwargs)
File "train_image_classifier.py", line 455, in clone_fn
logits, end_points = network_fn(images)
File "c:\utils\models-master\slim\nets\nets_factory.py", line 105, in network_fn
return func(images, num_classes, is_training=is_training)
File "c:\utils\models-master\slim\nets\inception_v1.py", line 290, in inception_v1
net, end_points = inception_v1_base(inputs, scope=scope)
File "c:\utils\models-master\slim\nets\inception_v1.py", line 96, in inception_v1_base
net = tf.concat(axis=3, values=[branch_0, branch_1, branch_2, branch_3])
TypeError: concat() got an unexpected keyword argument 'axis'
답글삭제
답글
익명2017년 7월 27일 오후 5:52
안녕하세요! 자세하게 글 올려주셔서 정말 감사합니다. 1번 과정을 하고 있었는데요 python3 train_image_classifier.py --train_dir=\tmp\train_inception_v1_flowers_logs --dataset_name=flowers --dataset_split_name=train --dataset_dir=/home/nicehe74/flowers --batch_size=16 --model_name=inception_v1 라고 명령어를 치니
INFO:tensorflow:global step 14560: loss = 0.4729 (0.161 sec/step) 이런식으로 뜨며 잘 돌아가다가 step이 끝나지 않아서 중간에 멈췄는데 아래와 같은 에러가 뜨며 아무것도 생성되지 않았네요..ㅠㅠ 혹시 좀 도움을 구할 수 있을까요?
Traceback (most recent call last):
File "train_image_classifier.py", line 573, in
tf.app.run()
File "/usr/local/lib/python3.4/dist-packages/tensorflow/python/platform/app.py", line 48, in run
_sys.exit(main(_sys.argv[:1] + flags_passthrough))
File "train_image_classifier.py", line 569, in main
sync_optimizer=optimizer if FLAGS.sync_replicas else None)
File "/usr/local/lib/python3.4/dist-packages/tensorflow/contrib/slim/python/slim/learning.py", line 749, in train
sess, train_op, global_step, train_step_kwargs)
File "/usr/local/lib/python3.4/dist-packages/tensorflow/contrib/slim/python/slim/learning.py", line 488, in train_step
run_metadata=run_metadata)
File "/usr/local/lib/python3.4/dist-packages/tensorflow/python/client/session.py", line 789, in run
run_metadata_ptr)
File "/usr/local/lib/python3.4/dist-packages/tensorflow/python/client/session.py", line 997, in _run
feed_dict_string, options, run_metadata)
File "/usr/local/lib/python3.4/dist-packages/tensorflow/python/client/session.py", line 1132, in _do_run
target_list, options, run_metadata)
File "/usr/local/lib/python3.4/dist-packages/tensorflow/python/client/session.py", line 1139, in _do_call
return fn(*args)
File "/usr/local/lib/python3.4/dist-packages/tensorflow/python/client/session.py", line 1121, in _run_fn
status, run_metadata)
답글삭제
답글
익명2017년 8월 21일 오후 6:58
안녕하세요 덕분에 slim을 잘 배우고 있습니다!!
혹시gpu가 아니라 cpu를 사용하면 문제가 발생할 수 있을까요?
물론 tensorflow는 cpu버전을 설치하였습니다.
혹시 에러가 궁금하실까 하여 아래에 내용을 복사하여 남김니다
---------------------------------------------------------------------------------
ERROR:tensorflow:==================================
Object was never used (type ):

If you want to mark it as used call its "mark_used()" method.
It was originally created here:
['File "train_image_classifier.py", line 573, in \n tf.app.run()', 'File "C:\\Users\\USER\\Anaconda3\\envs\\tensorflow\\lib\\site-packages\\tensorflow\\python\\platform\\app.py", line 48, in run\n _sys.exit(main(_sys.argv[:1] + flags_passthrough))', 'File "train_image_classifier.py", line 569, in main\n sync_optimizer=optimizer if FLAGS.sync_replicas else None)', 'File "C:\\Users\\USER\\Anaconda3\\envs\\tensorflow\\lib\\site-packages\\tensorflow\\contrib\\slim\\python\\slim\\learning.py", line 655, in train\n ready_op = tf_variables.report_uninitialized_variables()', 'File "C:\\Users\\USER\\Anaconda3\\envs\\tensorflow\\lib\\site-packages\\tensorflow\\python\\util\\tf_should_use.py", line 170, in wrapped\n return _add_should_use_warning(fn(*args, **kwargs))', 'File "C:\\Users\\USER\\Anaconda3\\envs\\tensorflow\\lib\\site-packages\\tensorflow\\python\\util\\tf_should_use.py", line 139, in _add_should_use_warning\n wrapped = TFShouldUseWarningWrapper(x)', 'File "C:\\Users\\USER\\Anaconda3\\envs\\tensorflow\\lib\\site-packages\\tensorflow\\python\\util\\tf_should_use.py", line 96, in __init__\n stack = [s.strip() for s in traceback.format_stack()]']
==================================

답글삭제
답글
Unknown2017년 10월 28일 오후 8:57
뭔가 에러가 나는데 아직까지 잘모르겠네요.
첫번째 방법인
python train_image_classifier.py --train_dir=\tmp\train_inception_v1_flowers_logs --dataset_name=flowers --dataset_split_name=train --dataset_dir=\tmp\flowers --batch_size=16 --model_name=

실행했을때

ValueError: Name of network unknown

이라는 에러가 나옵니다.

slim\nets\nets_factory.py에서 에러가 났다고 나와서

소스를 보니 networks_map이라는 배열이있고 이 안에있는 네트워크 값이 아닌 다른 값이 넘어와서 에러가 나는것같은데.. 이걸 어떻게 찾아서 해결해야될지 모르겠네요..
답글삭제
답글
Unknown2017년 12월 16일 오전 3:04
작성자가 댓글을 삭제했습니다.
답글삭제
답글
Unknown2017년 12월 16일 오전 3:06
작성자가 댓글을 삭제했습니다.
답글삭제
답글
익명2018년 3월 22일 오전 11:06
안녕하세요 혹시 max number step이 아닌 일반 training step은 어떤식으로 적용해야 할까요? .
계속적으로 train_image_classifier.py 돌리고 싶은데 max number step 을 수정하지 않는 방법을 알고 싶습니다.

혹시 알고 계신가요?
답글삭제
답글
익명2020년 3월 23일 오후 5:02
Inception 네트워크의 경우 블로그대로 저의 dataset을 fine-tuning에 잘썻습니다.
다만, mobilenet 의 경우 fine-tuning 에 대한 정보가 너무 없네요.
Checkpoint dir을 잘 작성하여도
ValueError: The passed save_path is not a valid checkpoint: /tmp/mobilenet_v1/checkpoints//mobilenet_v2_1.0_224.ckpt

와 같은 에러가 발생합니다.

slim에 있는 train_image_classifier.py 는 오직 inception에서만 작동하나요?
답글삭제
답글