glue schema와 다른 데이터가 왔을 때 조치한 썰
·
AWS
상황최근에 신규 데이터 요청이 들어왔다. 요청이 올 때 엑셀로 각 컬럼명과 타입 그리고 컬럼설명이 포함되어 온다. RDB가 아닌 테이블이라 다른 요청 사항은 없다. 사용자의 요청대로 생성을 하였고 테스트 데이터를 요청하였다. 그런데 요청한 측에서 타입이 맞지 않다고 했다. 에러내용은 다음과 같았다.awsathena error : HIVE_BAD_DATA Field day's type BINARY in parquet file ${s3_path} is incompatible with type timestamp(3) defined in table schema요약하자면 timestamp 타입을 가진 컬럼이 있는데, 해당 컬럼은 현재 BINARY로 들어와있다는 것이다. 참고로 우리는 최종 데이터를 parquet ..