#!/usr/bin/env python3
"""
개별 WSDL 파일을 Drizzle 스키마로 변환하는 스크립트
Usage: python3 wsdl_comment_to_drizzle_schema.py --wsdl IF_ECC_EVCP_PR_INFORMATION.wsdl
"""

import argparse
import os
import re
import xml.etree.ElementTree as ET
from pathlib import Path
from typing import Dict, List, Set, Tuple, Optional
from collections import defaultdict
import sys
from datetime import datetime

class ColorLogger:
    """컬러 로깅을 위한 클래스"""
    
    # ANSI 컬러 코드
    COLORS = {
        'RESET': '\033[0m',
        'BOLD': '\033[1m',
        'DIM': '\033[2m',
        
        # 기본 컬러
        'BLACK': '\033[30m',
        'RED': '\033[31m',
        'GREEN': '\033[32m',
        'YELLOW': '\033[33m',
        'BLUE': '\033[34m',
        'MAGENTA': '\033[35m',
        'CYAN': '\033[36m',
        'WHITE': '\033[37m',
        
        # 밝은 컬러
        'BRIGHT_BLACK': '\033[90m',
        'BRIGHT_RED': '\033[91m',
        'BRIGHT_GREEN': '\033[92m',
        'BRIGHT_YELLOW': '\033[93m',
        'BRIGHT_BLUE': '\033[94m',
        'BRIGHT_MAGENTA': '\033[95m',
        'BRIGHT_CYAN': '\033[96m',
        'BRIGHT_WHITE': '\033[97m',
        
        # 배경 컬러
        'BG_RED': '\033[41m',
        'BG_GREEN': '\033[42m',
        'BG_YELLOW': '\033[43m',
        'BG_BLUE': '\033[44m',
    }
    
    def __init__(self, enable_colors: bool = True):
        """
        컬러 로거 초기화
        Args:
            enable_colors: Windows CMD에서는 False로 설정 가능
        """
        self.enable_colors = enable_colors and self._supports_color()
    
    def _supports_color(self) -> bool:
        """컬러 지원 여부 확인"""
        # Windows에서 colorama가 없으면 컬러 비활성화
        if os.name == 'nt':
            try:
                import colorama
                colorama.init()
                return True
            except ImportError:
                return False
        return True
    
    def _colorize(self, text: str, color: str) -> str:
        """텍스트에 컬러 적용"""
        if not self.enable_colors:
            return text
        return f"{self.COLORS.get(color, '')}{text}{self.COLORS['RESET']}"
    
    def header(self, text: str):
        """헤더 로그 (굵은 파란색)"""
        colored_text = self._colorize(text, 'BOLD')
        colored_text = self._colorize(colored_text, 'BRIGHT_BLUE')
        print(colored_text)
    
    def info(self, text: str):
        """정보 로그 (파란색)"""
        colored_text = self._colorize(text, 'BLUE')
        print(colored_text)
    
    def success(self, text: str):
        """성공 로그 (초록색)"""
        colored_text = self._colorize(text, 'BRIGHT_GREEN')
        print(colored_text)
    
    def warning(self, text: str):
        """경고 로그 (노란색)"""
        colored_text = self._colorize(text, 'BRIGHT_YELLOW')
        print(colored_text)
    
    def error(self, text: str):
        """에러 로그 (빨간색)"""
        colored_text = self._colorize(text, 'BRIGHT_RED')
        print(colored_text)
    
    def debug(self, text: str):
        """디버그 로그 (회색)"""
        colored_text = self._colorize(text, 'BRIGHT_BLACK')
        print(colored_text)
    
    def table_info(self, text: str):
        """테이블 정보 로그 (시안색)"""
        colored_text = self._colorize(text, 'CYAN')
        print(colored_text)
    
    def field_info(self, text: str):
        """필드 정보 로그 (마젠타)"""
        colored_text = self._colorize(text, 'MAGENTA')
        print(colored_text)
    
    def separator(self, char: str = "=", length: int = 80):
        """구분선 출력 (굵은 흰색)"""
        line = char * length
        colored_line = self._colorize(line, 'BOLD')
        print(colored_line)

# 전역 로거 인스턴스
logger = ColorLogger()

class WSDLAnalyzer:
    def __init__(self, wsdl_file: str, table_prefix: Optional[str] = None):
        """
        WSDL 파일 분석기 초기화
        Args:
            wsdl_file: 분석할 WSDL 파일 경로
            table_prefix: 테이블 접두사 (옵션)
        """
        self.wsdl_file = Path(wsdl_file)
        self.table_prefix = table_prefix
        self.tables = defaultdict(dict)  # table_name -> {field_name: field_info}
        self.table_hierarchy = defaultdict(list)  # parent -> [children]
        
        # 필드명 매핑 규칙 정의 (필요시 확장 가능)
        self.field_name_mappings = {}
        
    def analyze_wsdl(self) -> Tuple[Dict, Dict]:
        """WSDL 파일을 분석하고 테이블 정보 반환"""
        if not self.wsdl_file.exists():
            raise FileNotFoundError(f"WSDL file not found: {self.wsdl_file}")
        
        logger.info(f"Analyzing {self.wsdl_file.name}...")
        
        try:
            with open(self.wsdl_file, 'r', encoding='utf-8') as f:
                content = f.read()
            
            # 우선 정규식으로 분석 시도 (주석에서 테이블 정보 추출)
            regex_count = self._extract_tables_from_regex(content, self.wsdl_file.name)
            
            # 정규식으로 찾지 못했을 때만 XML 파싱 시도
            if regex_count == 0:
                try:
                    # XML 네임스페이스 등록
                    namespaces = {
                        'xsd': 'http://www.w3.org/2001/XMLSchema',
                        'wsdl': 'http://schemas.xmlsoap.org/wsdl/'
                    }
                    
                    root = ET.fromstring(content)
                    self._extract_tables_from_xml(root, self.wsdl_file.name, namespaces)
                except ET.ParseError as e:
                    logger.error(f"  XML parsing failed: {e}")
                except Exception as e:
                    logger.error(f"  XML analysis error: {e}")
            
            # 테이블별 필드 합집합 처리
            self._merge_table_fields()
            
            return self.tables, self.table_hierarchy
            
        except Exception as e:
            logger.error(f"  Error analyzing {self.wsdl_file.name}: {e}")
            raise
    
    def _merge_table_fields(self):
        """테이블별 필드 합집합 처리"""
        merged_tables = defaultdict(dict)
        
        for table_name, fields in self.tables.items():
            # 테이블별 필드를 실제 필드명 기준으로 그룹화
            field_groups = defaultdict(list)  # actual_field_name -> [field_infos]
            
            for field_key, field_info in fields.items():
                # field_key에서 실제 필드명 추출 (|| 구분자 사용)
                actual_field_name = field_key.split('||')[0] if '||' in field_key else field_key
                field_groups[actual_field_name].append(field_info)
            
            # 각 필드 그룹을 병합
            for actual_field_name, field_infos in field_groups.items():
                # 첫 번째 필드 정보를 기준으로 시작
                merged_field = field_infos[0].copy()
                
                # 모든 WSDL 소스 수집
                all_sources = set()
                all_descriptions = set()
                
                for field_info in field_infos:
                    all_sources.add(field_info['wsdl_source'])
                    if field_info['description'].strip():
                        all_descriptions.add(field_info['description'].strip())
                    
                    # 필수 필드인 경우 유지
                    if field_info['mandatory'] == 'M':
                        merged_field['mandatory'] = 'M'
                
                # 병합된 정보 설정
                merged_field['wsdl_sources'] = all_sources
                
                # 설명 병합 (첫 번째 설명 사용)
                if all_descriptions:
                    merged_field['description'] = list(all_descriptions)[0]
                else:
                    merged_field['description'] = f'From {self.wsdl_file.name}'
                
                # 테이블에 추가 (실제 필드명 사용)
                merged_tables[table_name][actual_field_name] = merged_field
        
        # 병합된 테이블 정보로 업데이트  
        self.tables = merged_tables
    
    def _extract_tables_from_xml(self, root: ET.Element, wsdl_name: str, namespaces: dict):
        """XML에서 테이블 정보 추출"""
        # complexType 요소들에서 테이블 구조 추출
        for complex_type in root.findall(".//xsd:complexType", namespaces):
            table_name = complex_type.get('name')
            if table_name:
                self._extract_fields_from_complex_type(complex_type, table_name, wsdl_name, namespaces)
    
    def _extract_tables_from_regex(self, content: str, wsdl_name: str) -> int:
        """정규식으로 테이블 정보 추출"""
        
        # 1단계: 모든 SEQ 주석 찾기
        all_comments = re.findall(r'<!-- SEQ:\d+.*?-->', content, re.DOTALL)
        
        matches = []
        for comment in all_comments:
            # 2단계: 단순한 파싱 방법 (콤마로 분할)
            comment = comment.strip()
            
            # 콤마로 분할해서 각 부분을 분석
            parts = comment.split(', ')
            
            if len(parts) >= 7:
                try:
                    table = parts[1].split(':')[1] if ':' in parts[1] else ''
                    field = parts[2].split(':')[1] if ':' in parts[2] else ''
                    mo = parts[3].split(':')[1] if ':' in parts[3] else ''
                    type_val = parts[4].split(':')[1] if ':' in parts[4] else ''
                    size = parts[5].split(':')[1] if ':' in parts[5] else ''
                    desc = parts[6].split(':')[1].replace(' -->', '') if ':' in parts[6] else ''
                    
                    matches.append((table, field, mo, type_val, size, desc))
                except (IndexError, ValueError):
                    # 파싱 실패 시 무시
                    continue
        
        for match in matches:
            table_path, field_name, mandatory, field_type, size, description = match
            
            # 필드명 매핑 적용
            original_field_name = field_name.strip()
            mapped_field_name = self._apply_field_name_mapping(original_field_name, wsdl_name)
            
            # 테이블 경로에서 실제 테이블명 추출
            table_parts = table_path.split('/')
            
            # 계층 구조 기록
            if len(table_parts) > 1:
                for i in range(len(table_parts) - 1):
                    parent = '/'.join(table_parts[:i+1])
                    child = '/'.join(table_parts[:i+2])
                    if child not in self.table_hierarchy[parent]:
                        self.table_hierarchy[parent].append(child)
            
            # 필드 정보 저장
            field_info = {
                'field_name': mapped_field_name,
                'original_field_name': original_field_name,
                'mandatory': mandatory.strip(),
                'type': field_type.strip(),
                'size': size.strip(),
                'description': description.strip(),
                'table_path': table_path,
                'wsdl_source': wsdl_name
            }
            
            # 테이블명 생성
            table_name = self._generate_table_name(table_path, wsdl_name)
            field_key = f"{mapped_field_name}||{table_path}"
            self.tables[table_name][field_key] = field_info
        
        logger.success(f"  Found {len(matches)} field definitions")
        return len(matches)
    
    def _extract_fields_from_complex_type(self, complex_type, table_name: str, wsdl_name: str, namespaces: dict):
        """complexType에서 필드 정보 추출"""
        for element in complex_type.findall(".//xsd:element", namespaces):
            field_name = element.get('name')
            field_type = element.get('type', 'unknown')
            min_occurs = element.get('minOccurs', '1')
            
            if field_name:
                field_info = {
                    'field_name': field_name,
                    'original_field_name': field_name,
                    'mandatory': 'M' if min_occurs != '0' else 'O',
                    'type': field_type,
                    'size': 'unknown',
                    'description': f'From {table_name}',
                    'table_path': table_name,
                    'wsdl_source': wsdl_name
                }
                
                # 테이블명 생성
                generated_table_name = self._generate_table_name(table_name, wsdl_name)
                field_key = f"{field_name}||{table_name}"
                self.tables[generated_table_name][field_key] = field_info

    def _apply_field_name_mapping(self, field_name: str, wsdl_name: str) -> str:
        """특정 WSDL 파일의 필드명을 매핑 규칙에 따라 변경"""
        for wsdl_pattern, mappings in self.field_name_mappings.items():
            if wsdl_pattern in wsdl_name.upper():
                if field_name in mappings:
                    original_name = field_name
                    mapped_name = mappings[field_name]
                    logger.debug(f"  Field mapping: {original_name} -> {mapped_name} (from {wsdl_name})")
                    return mapped_name
        return field_name
    
    def _generate_table_name(self, table_path: str, wsdl_name: str) -> str:
        """테이블명 생성"""
        # 테이블 접두사 생성
        if self.table_prefix:
            prefix = self.table_prefix
        else:
            # WSDL 파일명에서 접두사 추출
            prefix = self._get_table_prefix_from_wsdl_name(wsdl_name)
        
        # 테이블 경로를 테이블명으로 변환
        table_suffix = table_path.replace('/', '_').upper()
        
        return f"{prefix}_{table_suffix}"
    
    def _get_table_prefix_from_wsdl_name(self, wsdl_name: str) -> str:
        """WSDL 파일명에서 테이블 prefix 추출"""
        # IF_XXX_EVCP_ 접두사 제거
        prefix = wsdl_name.replace('.wsdl', '')
        # 일반적인 접두사 패턴 제거
        for pattern in ['IF_MDZ_EVCP_', 'IF_ECC_EVCP_', 'IF_']:
            if prefix.startswith(pattern):
                prefix = prefix[len(pattern):]
                break
        return prefix if prefix else 'COMMON'

def map_wsdl_type_to_drizzle(wsdl_type: str, size: str) -> str:
    """WSDL 타입을 Drizzle 타입으로 매핑"""
    # 기본 길이 설정
    default_length = 100
    min_length = 10
    max_length = 2000
    
    # LCHR 타입은 text()로 처리
    if 'LCHR' in wsdl_type.upper():
        return "text()"
    
    # 사이즈 처리
    if size and size.strip():
        try:
            size_clean = size.strip()
            
            # "n,m" 형태 처리 (소수점 있는 숫자 타입 또는 numeric 타입)
            if ',' in size_clean:
                parts = size_clean.split(',')
                if len(parts) == 2 and parts[0].isdigit() and parts[1].isdigit():
                    total_digits = int(parts[0])
                    decimal_places = int(parts[1])
                    
                    # numeric 타입 처리
                    if 'NUMERIC' in wsdl_type.upper() or 'CURR' in wsdl_type.upper() or 'NUMC' in wsdl_type.upper() or 'NUMB' in wsdl_type.upper() or 'DEC' in wsdl_type.upper():
                        # numeric 타입은 decimal 또는 varchar로 처리
                        if decimal_places > 0:
                            # 소수점이 있는 경우 decimal 타입 사용
                            return f"decimal({{ precision: {total_digits}, scale: {decimal_places} }})"
                        else:
                            # 소수점이 없는 경우 integer 또는 varchar 사용
                            if total_digits <= 10:
                                return "integer()"
                            else:
                                return f"varchar({{ length: {total_digits + 2} }})"
                    else:
                        # 기타 타입은 방어적 계산
                        safe_length = total_digits + 5
                        safe_length = max(min_length, min(safe_length, max_length))
                        return f"varchar({{ length: {safe_length} }})"
            
            # 단순 숫자 처리
            elif size_clean.isdigit():
                original_length = int(size_clean)
                safe_length = max(min_length, min(original_length, max_length))
                return f"varchar({{ length: {safe_length} }})"
            
            # "n.m" 형태 처리
            elif '.' in size_clean:
                parts = size_clean.split('.')
                if len(parts) == 2 and parts[0].isdigit() and parts[1].isdigit():
                    total_digits = int(parts[0])
                    decimal_places = int(parts[1])
                    
                    # numeric 타입 처리
                    if 'NUMERIC' in wsdl_type.upper() or 'CURR' in wsdl_type.upper() or 'NUMC' in wsdl_type.upper() or 'NUMB' in wsdl_type.upper() or 'DEC' in wsdl_type.upper():
                        if decimal_places > 0:
                            return f"decimal({{ precision: {total_digits}, scale: {decimal_places} }})"
                        else:
                            if total_digits <= 10:
                                return "integer()"
                            else:
                                return f"varchar({{ length: {total_digits + 2} }})"
                    else:
                        safe_length = total_digits + 5
                        safe_length = max(min_length, min(safe_length, max_length))
                        return f"varchar({{ length: {safe_length} }})"
            
            # 기타 형태는 기본값 사용
            else:
                logger.warning(f"  ⚠️  알 수 없는 사이즈 형태: '{size_clean}' -> 기본값 {default_length} 사용")
                return f"varchar({{ length: {default_length} }})"
                
        except Exception as e:
            logger.error(f"  ❌ 사이즈 파싱 오류: '{size}' -> 기본값 {default_length} 사용, 오류: {e}")
            return f"varchar({{ length: {default_length} }})"
    
    # 사이즈가 없거나 비어있는 경우 기본값
    return f"varchar({{ length: {default_length} }})"

def generate_drizzle_schema(wsdl_tables: Dict, wsdl_file: str) -> str:
    """Drizzle 스키마 코드 생성"""
    wsdl_name = Path(wsdl_file).stem
    
    schema_code = [
        "import { integer, varchar, text, timestamp, decimal } from 'drizzle-orm/pg-core';",
        "import { mdgSchema } from '../../../db/schema/MDG/mdg';",
        "",
        f"// WSDL 파일: {wsdl_name}.wsdl",
        f"// 생성일시: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}",
        "// 자동 생성된 스키마 파일 - 인터페이스 정의서가 비정형인 만큼, 스케치 용도로 사용하고, 실제 구현을 위해선 점검이 필수입니다.",
        "",
    ]
    
    # 테이블 코드 생성
    for table_name, fields in sorted(wsdl_tables.items()):
        schema_code.append(f"// Table: {table_name}")
        schema_code.append(f"export const {table_name} = mdgSchema.table('{table_name}', {{")
        schema_code.append("  id: integer('id').primaryKey().generatedByDefaultAsIdentity(),")
        
        for field_name, field_info in sorted(fields.items()):
            drizzle_type = map_wsdl_type_to_drizzle(field_info['type'], field_info['size'])
            mandatory = ".notNull()" if field_info['mandatory'] == 'M' else ""
            
            comment = f" // {field_info['description']}" if field_info['description'] else ""
            wsdl_source = f" // From: {field_info['wsdl_source']}"
            mandatory_comment = f" // Required" if field_info['mandatory'] == 'M' else ""
            
            schema_code.append(f"  {field_name}: {drizzle_type}{mandatory},{comment}{wsdl_source}{mandatory_comment}")
        
        schema_code.append("  ")
        schema_code.append("  createdAt: timestamp('created_at').defaultNow().notNull(),")
        schema_code.append("  updatedAt: timestamp('updated_at').defaultNow().notNull(),")
        schema_code.append("});")
        schema_code.append("")
    
    return '\n'.join(schema_code)

def print_analysis_summary(wsdl_tables: Dict, detailed: bool = False):
    """분석 결과 요약 출력"""
    logger.separator()
    logger.header("분석 결과 요약")
    logger.separator()
    
    logger.info(f"총 테이블 수: {len(wsdl_tables)}")
    
    total_fields = 0
    for table_name, fields in wsdl_tables.items():
        field_count = len(fields)
        total_fields += field_count
        logger.table_info(f"  - {table_name}: {field_count} fields")
    
    logger.info(f"총 필드 수: {total_fields}")
    
    if detailed:
        logger.separator()
        logger.header("상세 필드 정보")
        logger.separator()
        
        for table_name, fields in wsdl_tables.items():
            logger.table_info(f"\n### {table_name}")
            for field_name, field_info in fields.items():
                logger.field_info(f"  {field_name}: {field_info['type']}({field_info['size']}) - {field_info['description']}")

def main():
    """메인 함수"""
    parser = argparse.ArgumentParser(
        description="WSDL 파일을 Drizzle 스키마로 변환",
        formatter_class=argparse.RawDescriptionHelpFormatter,
        epilog="""
사용 예시:
  %(prog)s --wsdl IF_ECC_EVCP_PR_INFORMATION.wsdl
  %(prog)s --wsdl path/to/file.wsdl --output-dir ./schemas
  %(prog)s --wsdl file.wsdl --table-prefix CUSTOM --detailed
        """
    )
    
    parser.add_argument('--wsdl', required=True, help='분석할 WSDL 파일 경로')
    parser.add_argument('--output-dir', help='출력 디렉토리 (기본값: WSDL 파일과 같은 디렉토리)')
    parser.add_argument('--table-prefix', help='테이블 접두사 (기본값: WSDL 파일명에서 추출)')
    parser.add_argument('--detailed', action='store_true', help='상세 분석 결과 출력')
    parser.add_argument('--no-colors', action='store_true', help='컬러 출력 비활성화')
    
    args = parser.parse_args()
    
    # 컬러 설정
    global logger
    logger = ColorLogger(enable_colors=not args.no_colors)
    
    try:
        # WSDL 파일 경로 처리
        wsdl_file = Path(args.wsdl)
        if not wsdl_file.is_absolute():
            wsdl_file = Path.cwd() / wsdl_file
        
        if not wsdl_file.exists():
            logger.error(f"WSDL 파일을 찾을 수 없습니다: {wsdl_file}")
            return 1
        
        # 출력 디렉토리 설정
        if args.output_dir:
            output_dir = Path(args.output_dir)
        else:
            output_dir = wsdl_file.parent
        
        output_dir.mkdir(parents=True, exist_ok=True)
        
        # 분석 시작
        logger.header(f"WSDL 분석 시작: {wsdl_file.name}")
        logger.info(f"입력 파일: {wsdl_file}")
        logger.info(f"출력 디렉토리: {output_dir}")
        
        # WSDL 분석
        analyzer = WSDLAnalyzer(str(wsdl_file), args.table_prefix)
        wsdl_tables, table_hierarchy = analyzer.analyze_wsdl()
        
        if not wsdl_tables:
            logger.warning("테이블이 발견되지 않았습니다.")
            return 1
        
        # 스키마 코드 생성
        schema_code = generate_drizzle_schema(wsdl_tables, str(wsdl_file))
        
        # 출력 파일 생성
        output_file = output_dir / f"{wsdl_file.stem}.ts"
        with open(output_file, 'w', encoding='utf-8') as f:
            f.write(schema_code)
        
        logger.success(f"스키마 파일이 생성되었습니다: {output_file}")
        
        # 분석 결과 요약
        print_analysis_summary(wsdl_tables, args.detailed)
        
        return 0
        
    except Exception as e:
        logger.error(f"오류 발생: {e}")
        return 1

if __name__ == "__main__":
    sys.exit(main())