VEGA_AE / Scripts /UnixCoder /run_one_model.py

unknown

Initial

de6b003 4 months ago

34.7 kB

	from __future__ import absolute_import
	import os
	from statistics import mean
	import sys
	from xml.sax.handler import feature_external_ges
	#import bleu
	import pickle
	import torch
	import csv
	import json
	import random
	import time
	import logging
	import argparse
	#from fuzzywuzzy import fuzz
	import numpy as np
	from io import open
	from itertools import cycle
	import torch.nn as nn
	from model_gen import Seq2Seq
	from tqdm import tqdm, trange
	from torch.utils.data import DataLoader, Dataset, SequentialSampler, RandomSampler, TensorDataset
	from torch.utils.data.distributed import DistributedSampler
	#from sklearn.metrics import mean_squared_error
	from transformers import (WEIGHTS_NAME, AdamW, get_linear_schedule_with_warmup,
	RobertaConfig, RobertaModel, RobertaTokenizer)

	import pathlib

	folder = str(pathlib.Path(__file__).parent.resolve())

	#from sklearn.metrics import mean_absolute_error, mean_squared_error
	logging.basicConfig(format='%(asctime)s - %(levelname)s - %(name)s - %(message)s',
	datefmt='%m/%d/%Y %H:%M:%S',
	level=logging.INFO)
	logger = logging.getLogger(__name__)


	divide_number = 6
	os.environ["CUDA_VISIBLE_DEVICES"] = "0,1,2,3,4,5,6,7"

	class Example(object):
	"""A single training/test example."""

	def __init__(self,
	idx,
	source,
	target,
	cpuname,
	funcname,
	filename,
	property,
	vec,
	exist,
	module
	):
	self.idx = idx
	self.source = source
	self.target = target
	self.cpuname = cpuname
	self.funcname = funcname
	self.filename = filename
	self.property = property
	self.vec = vec
	self.exist = exist
	self.module = module


	def read_examples_no_bracket(filename, is_function_test):
	"""Read examples from filename."""
	examples = []
	with open(filename, encoding="utf-8") as f:
	for idx, line in enumerate(f):
	if is_function_test:
	if idx > 212:
	break
	line = line.strip()
	js = json.loads(line)
	if js["Stmt"].strip()[0] == "}":
	continue
	if js["Value"].strip().lower() == "nothing" and '#' in js['FIR']:
	continue
	if '1' in js['Vector'][-97:] and '#' not in js['FIR']:
	continue
	if 'idx' not in js:
	js['idx'] = idx
	code = ' '.join(js['FIR_token']).replace('\n', ' ')
	code = ' '.join(code.strip().split())
	nl = ' '.join(js['Stmt_token']).replace('\n', ' ')
	nl = ' '.join(nl.strip().split())
	if str(js['Exist']).lower() != "true" and str(js['Exist']).lower() != "false":
	if int(round(float(js['Exist']))) == 1:
	exist = 1
	elif js["Value"].strip().lower() != "nothing":
	exist = 1
	else:
	exist = 0
	else:
	if js['Exist'].lower() == "true":
	exist = 1
	else:
	exist = 0
	tem = list(js['Vector'].replace("\|zm\|",""))
	vec = []
	for t in tem:
	if int(t) == 1:
	vec.append(1)
	else:
	vec.append(0)
	pro = ' '.join(js['Value_token']).replace('\n', ' ')
	pro = ' '.join(pro.strip().split())

	cpu = js['Target']
	func = js['Func']
	file = js['File']
	mod = ""
	if "Module" in js.keys():
	mod = js["Module"]
	examples.append(
	Example(
	idx=idx,
	source=code,
	target=nl,
	cpuname=cpu,
	funcname=func,
	filename=file,
	property=pro,
	vec=vec,
	exist=exist,
	module = mod
	# propertyposition = propos,
	)
	)
	return examples


	def read_examples(filename, is_function_test):
	"""Read examples from filename."""
	examples = []
	with open(filename, encoding="utf-8") as f:
	for idx, line in enumerate(f):
	if is_function_test:
	if idx > 212:
	break
	line = line.strip()
	js = json.loads(line)
	if 'idx' not in js:
	js['idx'] = idx
	code = ' '.join(js['FIR_token']).replace('\n', ' ')
	code = ' '.join(code.strip().split())
	nl = ' '.join(js['Stmt_token']).replace('\n', ' ')
	nl = ' '.join(nl.strip().split())
	if str(js['Exist']).lower() != "true" and str(js['Exist']).lower() != "false":
	if int(round(float(js['Exist']))) == 1:
	exist = 1
	elif js["Value"].strip().lower() != "nothing":
	exist = 1
	else:
	exist = 0
	else:
	if js['Exist'].lower() == "true":
	exist = 1
	else:
	exist = 0
	tem = list(js['Vector'].replace("\|zm\|",""))
	vec = []
	for t in tem:
	if int(t) == 1:
	vec.append(1)
	else:
	vec.append(0)
	pro = ' '.join(js['Value_token']).replace('\n', ' ')
	pro = ' '.join(pro.strip().split())

	cpu = js['Target']
	func = js['Func']
	file = js['File']
	mod = ""
	if "Module" in js.keys():
	mod = js["Module"]
	examples.append(
	Example(
	idx=idx,
	source=code,
	target=nl,
	cpuname=cpu,
	funcname=func,
	filename=file,
	property=pro,
	vec=vec,
	exist=exist,
	module = mod
	# propertyposition = propos,
	)
	)
	return examples


	class InputFeatures(object):
	"""A single training/test features for a example."""

	def __init__(self,
	example_id,
	source_ids,
	exist,
	target_ids,
	):
	self.example_id = example_id
	self.source_ids = source_ids
	self.exist = exist
	self.target_ids = target_ids


	def convert_examples_to_features(examples, tokenizer, args, stage=None):
	"""convert examples to token ids"""
	features = []
	for example_index, example in enumerate(examples):
	# source
	func_tokens = tokenizer.tokenize(example.funcname)
	source_tokens = tokenizer.tokenize(
	example.source)
	pro_tokens = tokenizer.tokenize(example.property)
	vec_tokens = example.vec
	source_tokens = [tokenizer.cls_token, "<encoder-decoder>", tokenizer.sep_token, "<mask0>"] + func_tokens + [tokenizer.cls_token] + \
	source_tokens + [tokenizer.cls_token] + pro_tokens + \
	[tokenizer.cls_token] + vec_tokens + [tokenizer.sep_token]
	source_ids = tokenizer.convert_tokens_to_ids(source_tokens)
	padding_length = args.max_source_length - len(source_ids)
	source_ids += [tokenizer.pad_token_id] * padding_length

	target_tokens = tokenizer.tokenize(example.target)
	exist = [example.exist]
	target_tokens = [tokenizer.cls_token, "<mask0>"] + \
	target_tokens + [tokenizer.sep_token]
	target_ids = tokenizer.convert_tokens_to_ids(target_tokens)
	padding_length = args.max_target_length - len(target_ids)
	target_ids += [tokenizer.pad_token_id] * padding_length

	features.append(
	InputFeatures(
	example_index,
	source_ids,
	exist,
	target_ids,
	)
	)
	return features


	def set_seed(seed=991105):
	random.seed(seed)
	os.environ['PYHTONHASHSEED'] = str(seed)
	np.random.seed(seed)
	torch.manual_seed(seed)
	torch.cuda.manual_seed(seed)
	torch.backends.cudnn.deterministic = True

	def is_valid_parentheses(s):
	cnt_bracket_small = 0
	cnt_bracket_mid = 0
	cnt_bracket_large = 0
	new_s = ""
	for p in s:
	new_s += p
	if p == "(":
	cnt_bracket_small += 1
	if p == ")":
	cnt_bracket_small -= 1
	if p == "[":
	cnt_bracket_mid += 1
	if p == "]":
	cnt_bracket_mid -= 1
	if p == "{":
	cnt_bracket_large += 1
	if p == "}":
	cnt_bracket_large -= 1
	if cnt_bracket_small < 0:
	cnt_bracket_small = 0
	new_s = new_s[:-1]
	#print(new_s)
	if cnt_bracket_mid < 0:
	cnt_bracket_mid = 0
	new_s = new_s[:-1]
	#print(new_s)
	if cnt_bracket_large < 0:
	cnt_bracket_large = 0
	new_s = new_s[:-1]
	#print(new_s)
	return new_s


	def rewrite_pred(pred, gt_pred, gt_source, gt_value):
	re_pred = pred
	if is_valid_parentheses(pred).replace(" ", "") == gt_pred.replace(" ", ""):
	return True, is_valid_parentheses(re_pred)
	if "zmtarzm" in gt_value and gt_source.replace("#", gt_value).replace(" ", "") == gt_pred.replace(" ", ""):
	return True, gt_source.replace("#", gt_value)
	return False, re_pred


	def vega_train_main():
	parser = argparse.ArgumentParser()

	# Required parameters
	parser.add_argument("--model_name_or_path", default=None, type=str, required=True,
	help="Path to pre-trained model: e.g. roberta-base")
	parser.add_argument("--output_dir", default=None, type=str, required=True,
	help="The output directory where the model predictions and checkpoints will be written.")

	# # Other parameters
	parser.add_argument("--train_filename", default=None, type=str,
	help="The train filename. Should contain the .jsonl files for this task.")
	parser.add_argument("--dev_filename", default=None, type=str,
	help="The dev filename. Should contain the .jsonl files for this task.")
	parser.add_argument("--test_filename", default=None, type=str,
	help="The test filename. Should contain the .jsonl files for this task.")
	parser.add_argument("--max_source_length", default=590, type=int, # 400
	help="The maximum total source sequence length after tokenization. Sequences longer "
	"than this will be truncated, sequences shorter will be padded.")
	parser.add_argument("--max_target_length", default=240, type=int, # 350
	help="The maximum total target sequence length after tokenization. Sequences longer "
	"than this will be truncated, sequences shorter will be padded.")
	parser.add_argument("--do_train", action='store_true',
	help="Whether to run training.")
	parser.add_argument("--do_eval", action='store_true',
	help="Whether to run eval on the dev set.")
	parser.add_argument("--do_test", action='store_true',
	help="Whether to run eval on the dev set.")
	parser.add_argument("--do_function_test", action='store_true',
	help="Whether to run eval on the subset of the dev set.")
	parser.add_argument("--no_cuda", action='store_true',
	help="Avoid using CUDA when available")

	parser.add_argument("--train_batch_size", default=8, type=int,
	help="Batch size per GPU/CPU for training.")
	parser.add_argument("--eval_batch_size", default=8, type=int,
	help="Batch size per GPU/CPU for evaluation.")
	parser.add_argument('--gradient_accumulation_steps', type=int, default=1,
	help="Number of updates steps to accumulate before performing a backward/update pass.")
	parser.add_argument("--learning_rate", default=6e-5, type=float,
	help="The initial learning rate for Adam.")
	parser.add_argument("--beam_size", default=1, type=int,
	help="beam size for beam search")
	parser.add_argument("--weight_decay", default=0.0, type=float,
	help="Weight deay if we apply some.")
	parser.add_argument("--adam_epsilon", default=1e-8, type=float,
	help="Epsilon for Adam optimizer.")
	parser.add_argument("--max_grad_norm", default=1.0, type=float,
	help="Max gradient norm.")
	parser.add_argument("--num_train_epochs", default=30, type=int,
	help="Total number of training epochs to perform.")
	parser.add_argument('--seed', type=int, default=20230420,
	help="random seed for initialization")

	parser.add_argument("--mse_loss_weight", default=0.9, type=float,
	help="Weight of Mean Square Error Loss.")
	parser.add_argument("--ce_loss_weight", default=0.1, type=float,
	help="Weight of Cross Entropy Loss.")

	# print arguments
	args = parser.parse_args()
	# set device
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	args.n_gpu = torch.cuda.device_count()
	args.device = device
	logger.info("device: %s, n_gpu: %s", device, args.n_gpu)

	# Set seed
	set_seed(args.seed)

	# make dir if output_dir not exist
	args.output_dir = folder + "/" + args.output_dir
	if os.path.exists(args.output_dir) is False:
	os.makedirs(args.output_dir)
	args.model_name_or_path = folder + "/" + args.model_name_or_path
	if args.train_filename:
	args.train_filename = folder + "/" + args.train_filename
	if args.dev_filename:
	args.dev_filename = folder + "/" + args.dev_filename
	if args.test_filename:
	args.test_filename = folder + "/" + args.test_filename
	# build model
	tokenizer = RobertaTokenizer.from_pretrained(args.model_name_or_path)
	config = RobertaConfig.from_pretrained(args.model_name_or_path)
	# import！！！you must set is_decoder as True for generation
	config.is_decoder = True
	encoder = RobertaModel.from_pretrained(
	args.model_name_or_path, config=config)

	model = Seq2Seq(encoder=encoder, decoder=encoder, config=config,
	mse_loss_weight=args.mse_loss_weight, ce_loss_weight=args.ce_loss_weight,
	beam_size=args.beam_size, max_length=args.max_target_length,
	sos_id=tokenizer.convert_tokens_to_ids(["<mask0>"])[0], eos_id=tokenizer.sep_token_id)

	model.to(args.device)

	if args.n_gpu > 1:
	# multi-gpu training
	model = torch.nn.DataParallel(model)

	if args.do_train:
	# Prepare training data loader
	all_examples = read_examples(args.train_filename, False)
	train_examples = read_examples_no_bracket(args.train_filename, False)
	train_features = convert_examples_to_features(
	train_examples, tokenizer, args, stage='train')
	all_source_ids = torch.tensor(
	[f.source_ids for f in train_features], dtype=torch.long)
	all_exists = torch.tensor(
	[f.exist for f in train_features], dtype=torch.float32)
	all_target_ids = torch.tensor(
	[f.target_ids for f in train_features], dtype=torch.long)
	train_data = TensorDataset(all_source_ids, all_exists, all_target_ids)
	train_sampler = RandomSampler(train_data)
	train_dataloader = DataLoader(train_data, sampler=train_sampler,
	batch_size=args.train_batch_size // args.gradient_accumulation_steps)

	# Prepare optimizer and schedule (linear warmup and decay)
	no_decay = ['bias', 'LayerNorm.weight']
	optimizer_grouped_parameters = [
	{'params': [p for n, p in model.named_parameters() if not any(nd in n for nd in no_decay)],
	'weight_decay': args.weight_decay},
	{'params': [p for n, p in model.named_parameters() if any(
	nd in n for nd in no_decay)], 'weight_decay': 0.0}
	]
	optimizer = AdamW(optimizer_grouped_parameters,
	lr=args.learning_rate, eps=args.adam_epsilon)
	scheduler = get_linear_schedule_with_warmup(optimizer,
	num_warmup_steps=int(
	len(train_dataloader)args.num_train_epochs0.1),
	num_training_steps=len(train_dataloader)*args.num_train_epochs)

	# Start training
	logger.info("*** Running training ***")
	logger.info(" Num examples = %d", len(all_examples))
	logger.info(" Batch size = %d", args.train_batch_size *
	args.gradient_accumulation_steps)
	logger.info(" Num epoch = %d", args.num_train_epochs)

	model.train()
	eval_examples_all = read_examples(args.dev_filename, False)
	total_eval_all = len(eval_examples_all)
	patience, best_acc, losses, dev_dataset = 0, 0, [], {}
	for epoch in tqdm(range(args.num_train_epochs)):
	for idx, batch in enumerate(train_dataloader):
	batch = tuple(t.to(device) for t in batch)
	source_ids, exist, target_ids = batch
	loss, _, _, mse_loss, ce_loss = model(
	source_ids=source_ids, exist=exist, target_ids=target_ids)

	if args.n_gpu > 1:
	loss = loss.mean() # mean() to average on multi-gpu.
	if args.gradient_accumulation_steps > 1:
	loss = loss / args.gradient_accumulation_steps

	losses.append(loss.item())
	loss.backward()
	if len(losses) % args.gradient_accumulation_steps == 0:
	# Update parameters
	optimizer.step()
	optimizer.zero_grad()
	scheduler.step()
	if len(losses) // args.gradient_accumulation_steps % 100 == 0:
	logger.info("epoch {} step {} loss {}".format(epoch,
	len(
	losses)//args.gradient_accumulation_steps,
	round(np.mean(losses[-100*args.gradient_accumulation_steps:]), 4)))
	if args.do_eval:
	# Eval model with dev dataset
	if 'dev_loss' in dev_dataset:
	eval_examples, eval_data = dev_dataset['dev_loss']
	else:
	eval_examples = read_examples_no_bracket(args.dev_filename, False)
	eval_features = convert_examples_to_features(
	eval_examples, tokenizer, args, stage='dev')
	all_source_ids = torch.tensor(
	[f.source_ids for f in eval_features], dtype=torch.long)
	all_exists = torch.tensor(
	[f.exist for f in eval_features], dtype=torch.float32)
	all_target_ids = torch.tensor(
	[f.target_ids for f in eval_features], dtype=torch.long)
	eval_data = TensorDataset(
	all_source_ids, all_exists, all_target_ids)
	dev_dataset['dev_loss'] = eval_examples, eval_data
	eval_sampler = SequentialSampler(eval_data)
	eval_dataloader = DataLoader(
	eval_data, sampler=eval_sampler, batch_size=args.eval_batch_size)

	logger.info("*** Running evaluation ***")
	logger.info(" Num examples = %d", total_eval_all)
	logger.info(" Batch size = %d", args.eval_batch_size)

	# Start Evaling model
	model.eval()
	eval_loss, tokens_num = 0, 0
	for batch in eval_dataloader:
	batch = tuple(t.to(device) for t in batch)
	source_ids, exist, target_ids = batch

	with torch.no_grad():
	_, loss, num, _, _ = model(
	source_ids=source_ids, exist=exist, target_ids=target_ids)
	eval_loss += loss.sum().item()
	tokens_num += num.sum().item()
	# Pring loss of dev dataset
	model.train()
	eval_loss = eval_loss / tokens_num
	result = {'eval_ppl': round(np.exp(eval_loss), 5)}
	for key in sorted(result.keys()):
	logger.info(" %s = %s", key, str(result[key]))
	logger.info(" " + "" 20)

	# Calculate mse
	if 'dev_acc' in dev_dataset:
	eval_examples, eval_data = dev_dataset['dev_acc']
	else:
	eval_examples = read_examples_no_bracket(args.dev_filename, False)
	eval_examples = random.sample(eval_examples, int(len(eval_examples) / divide_number))
	eval_features = convert_examples_to_features(
	eval_examples, tokenizer, args, stage='test')
	all_source_ids = torch.tensor(
	[f.source_ids for f in eval_features], dtype=torch.long)
	eval_data = TensorDataset(all_source_ids)
	dev_dataset['dev_acc'] = eval_examples, eval_data

	eval_sampler = SequentialSampler(eval_data)
	eval_dataloader = DataLoader(
	eval_data, sampler=eval_sampler, batch_size=args.eval_batch_size)
	model.eval()
	pp = []
	pr = []
	for batch in eval_dataloader:
	batch = tuple(t.to(device) for t in batch)
	source_ids = batch[0]
	with torch.no_grad():
	preds, predicates = model(source_ids)
	# convert ids to text
	for pred, predicate in zip(preds, predicates):
	t = pred[0].cpu().numpy()
	p = predicate.float().item()
	t = list(t)
	#p = list(p)
	tem_i = 0
	if 0 in t:
	for my_i in range(len(t) - 1, 0, -1):
	if t[my_i] != 0:
	break
	tem_i -= 1
	if tem_i < 0:
	t = t[:tem_i]
	text = tokenizer.decode(
	t, clean_up_tokenization_spaces=False)
	pp.append(text)
	pr.append(p)
	model.train()

	p_wrong_list = []
	v_wrong_list = []
	model_predicate = []
	groundtruth_predicate = []
	#edit_sim = 0.0
	total = int(total_eval_all / divide_number)
	base_num = total - len(eval_examples)
	EM = float(base_num)
	EM_V = float(base_num)
	EM_P = float(base_num)
	cnt_v = 0
	cnt_p = 0
	cnt_iteration = 0
	for ref, gold in zip(zip(pp, pr), eval_examples):
	cnt_iteration += 1
	pred = ref[0].strip()
	predicate = ref[1]
	if gold.property.strip().lower() != "nothing":
	predicate = 1.0
	else:
	pred = gold.source.strip()
	if 1 not in gold.vec:
	predicate = 0.0
	if 1 in gold.vec and gold.source.strip()[0] == '}':
	predicate = 1.0
	if '#' in gold.source:
	predicate = 0.0
	if 1 in gold.vec[-97:]:
	predicate = 1.0
	gt_pred = gold.target.strip()
	gt_predicate = gold.exist


	if pred == gt_pred and int(round(predicate)) == int(round(gt_predicate)):
	EM = EM + 1.0
	EM_V = EM_V + 1.0
	EM_P = EM_P + 1.0
	else:
	if pred == gt_pred:
	EM_V = EM_V + 1.0
	else:
	v_wrong_list.append([gold.filename, gold.funcname, gold.cpuname,\
	round(predicate), gt_predicate, pred, gt_pred])
	cnt_v += 1
	if int(round(predicate)) == int(round(gt_predicate)):
	EM_P = EM_P + 1.0
	else:
	cnt_p += 1
	p_wrong_list.append([gold.filename, gold.funcname, gold.cpuname,\
	round(predicate), gt_predicate, pred, gt_pred])

	model_predicate.append(predicate)
	groundtruth_predicate.append(gt_predicate)
	dev_acc = round((100*EM/total), 2)
	dev_acc_v = round((100*EM_V/total), 2)
	dev_acc_p = round((100*EM_P/total), 2)
	logger.info(" %s = %s " % ("Current Acc", str(dev_acc)))
	logger.info(" "+""20)
	logger.info(" %s = %s " % ("Current Acc V", str(dev_acc_v)))
	logger.info(" "+""20)
	logger.info(" %s = %s " % ("Current Acc P", str(dev_acc_p)))
	logger.info(" "+""20)
	if dev_acc > best_acc:
	best_acc = dev_acc
	# Save best checkpoint for best bleu
	output_dir = os.path.join(
	args.output_dir, 'checkpoint-best-acc')
	if not os.path.exists(output_dir):
	os.makedirs(output_dir)
	model_to_save = model.module if hasattr(
	model, 'module') else model # Only save the model it-self
	output_model_file = os.path.join(
	output_dir, "pytorch_model.bin")
	torch.save(model_to_save.state_dict(), output_model_file)
	logger.info(" Best acc:%s", best_acc)
	logger.info(" " + "" 20)


	if args.do_test or args.do_function_test:
	if os.path.exists(args.output_dir+"/result.jsonl"):
	os.unlink(args.output_dir+"/result.jsonl")
	checkpoint_prefix = 'checkpoint-best-acc/pytorch_model.bin'
	output_dir = os.path.join(args.output_dir, checkpoint_prefix)
	model_to_load = model.module if hasattr(model, 'module') else model
	model_to_load.load_state_dict(torch.load(output_dir), strict=False)

	eval_examples_all = read_examples(args.test_filename, args.do_function_test)
	eval_examples = read_examples_no_bracket(args.test_filename, args.do_function_test)


	total_all = len(eval_examples_all)
	base_test = total_all - len(eval_examples)


	eval_features = convert_examples_to_features(
	eval_examples, tokenizer, args, stage='test')
	all_source_ids = torch.tensor(
	[f.source_ids for f in eval_features], dtype=torch.long)
	eval_data = TensorDataset(all_source_ids)

	eval_examples_idx_lis = []
	for ee in eval_examples:
	eval_examples_idx_lis.append(ee.idx)
	# Calculate mse
	eval_sampler = SequentialSampler(eval_data)
	eval_dataloader = DataLoader(
	eval_data, sampler=eval_sampler, batch_size=args.eval_batch_size)

	model.eval()
	pp = []
	pr = []
	if not args.do_function_test:
	print("Start Inferencing!")
	else:
	print("Start Function Test Inferencing!")
	for batch in eval_dataloader:
	batch = tuple(t.to(device) for t in batch)
	source_ids = batch[0]
	with torch.no_grad():
	preds, predicates = model(source_ids)
	# convert ids to text
	for pred, predicate in zip(preds, predicates):
	t = pred[0].cpu().numpy()
	p = predicate.float().item()
	t = list(t)
	tem_i = 0
	if 0 in t:
	for my_i in range(len(t)-1, 0, -1):
	if t[my_i] != 0:
	break
	tem_i -= 1
	if tem_i < 0:
	t = t[:tem_i]
	text = tokenizer.decode(
	t, clean_up_tokenization_spaces=False)
	pp.append(text)
	pr.append(p)
	if not args.do_function_test:
	print("Finished Inferencing.")
	else:
	print("Finished Function Test Inferencing.")
	model.train()
	EM = float(base_test)
	EM_P = float(base_test)
	EM_V = float(base_test)
	p_wrong_list = []
	v_wrong_list = []
	edit_sim = 0.0
	total = total_all
	res_dic = {}

	model_predicate = []
	groundtruth_predicate = []

	for ref, gold in zip(zip(pp, pr), eval_examples):
	pred = ref[0].strip()
	predicate = ref[1]
	if gold.property.strip().lower() != "nothing":
	predicate = 1.0
	else:
	pred = gold.source.strip()
	if 1 not in gold.vec:
	predicate = 0.0
	if 1 in gold.vec and gold.source.strip()[0] == '}':
	predicate = 1.0
	if '#' in gold.source:
	predicate = 0.0
	if 1 in gold.vec[-97:]:
	predicate = 1.0
	gt_pred = gold.target.strip()
	gt_predicate = gold.exist
	is_re = False
	gt_value = gold.property
	gt_source = gold.source
	if pred == gt_pred and round(predicate) == gt_predicate:
	EM += 1
	if pred == gt_pred and round(predicate) != gt_predicate:
	p_wrong_list.append([gold.filename, gold.funcname, gold.cpuname, gold.idx,
	round(predicate), gt_predicate, pred, gt_pred])
	if pred != gt_pred and round(predicate) == gt_predicate:
	is_re, re_pred = rewrite_pred(pred, gt_pred, gt_source, gt_value)
	if not is_re:
	v_wrong_list.append([gold.filename, gold.funcname, gold.cpuname, gold.idx,
	round(predicate), gt_predicate, pred, gt_pred])
	else:
	pred = re_pred
	EM += 1
	if pred != gt_pred and round(predicate) != gt_predicate:
	v_wrong_list.append([gold.filename, gold.funcname, gold.cpuname, gold.idx,
	round(predicate), gt_predicate, pred, gt_pred])
	p_wrong_list.append([gold.filename, gold.funcname, gold.cpuname, gold.idx,
	round(predicate), gt_predicate, pred, gt_pred])
	tem_dic = {}
	tem_dic["idx"] = gold.idx
	tem_dic["vega_code"] = pred
	tem_dic["ans_code"] = gt_pred
	tem_dic["vega_pre"] = round(predicate)
	tem_dic["ans_pre"] = gt_predicate
	tem_dic["File"] = gold.filename
	tem_dic["Func"] = gold.funcname
	tem_dic["Module"] = gold.module
	tem_dic["Target"] = gold.cpuname
	res_dic[gold.idx] = tem_dic

	if pred == gt_pred:
	EM_V += 1
	if round(predicate) == gt_predicate:
	EM_P += 1
	model_predicate.append(predicate)
	groundtruth_predicate.append(gt_predicate)
	dev_acc = round((100 * EM / total), 2)
	dev_acc_v = round((100 * EM_V / total), 2)
	dev_acc_p = round((100 * EM_P / total), 2)
	predictions = []


	with open(args.output_dir+"/result.jsonl", 'a') as f2:
	for ee in eval_examples_all:
	if ee.idx not in eval_examples_idx_lis:
	dic = {}
	dic["idx"] = ee.idx
	dic["vega_code"] = ee.source.replace("zmtarzm", ee.cpuname)
	dic["ans_code"] = ee.source.replace("zmtarzm", ee.cpuname)
	dic["vega_pre"] = ee.exist
	dic["ans_pre"] = ee.exist
	dic["File"] = ee.filename
	dic["Func"] = ee.funcname
	dic["Module"] = ee.module
	dic["Target"] = ee.cpuname
	dic["Stable"] = "True"
	else:
	dic = {}
	dic["idx"] = res_dic[ee.idx]["idx"]
	dic["vega_code"] = res_dic[ee.idx]["vega_code"].replace("zmtarzm", ee.cpuname)
	dic["ans_code"] = res_dic[ee.idx]["ans_code"].replace("zmtarzm", ee.cpuname)
	dic["vega_pre"] = res_dic[ee.idx]["vega_pre"]
	dic["ans_pre"] = res_dic[ee.idx]["ans_pre"]
	dic["File"] = res_dic[ee.idx]["File"]
	dic["Func"] = res_dic[ee.idx]["Func"]
	dic["Module"] = res_dic[ee.idx]["Module"]
	dic["Target"] = res_dic[ee.idx]["Target"]
	dic["Stable"] = "False"

	json.dump(dic, f2)
	f2.write('\n')



	if __name__ == "__main__":
	vega_train_main()