💌 Email : [email protected]
😺 Github : https://github.com/chaiwon1
✅ Blog : https://velog.io/@bgly
사내의 다양한 데이터 수요자들이 필요한 형태로 효율적으로 데이터를 소비할 수 있도록 스케일러블한 데이터 아키텍처를 그리고 만드는 데이터 엔지니어입니다. 데이터 파이프라인의 구축과 유지보수에 관심이 많으며, 데이터 품질을 향상시키고 분석가와 사이언티스트들에게 가치 있는 데이터를 제공하기 위해 노력합니다.
ETL업무 뿐 아니라 Data Lake부터 Data Warehouse, Data Mart까지 다양한 데이터 플랫폼 구축 경험이 있으며, MLOps 및 데이터 분석 업무와 대시보드 구축도 경험하였습니다. 또한, NLP 처리를 위한 학습데이터 관리 플랫폼을 Django로 구축할 만큼 백엔드와 DL 파트에도 큰 관심을 가지고 있습니다.
데이터를 다루는 많은 팀과의 커뮤니케이션과 협업의 중요성을 알고 있으며, 기존 방식의 문제점을 명확히 하고 다양한 실험을 통해 해결책을 찾아나가는 것을 좋아합니다.
Data | Spark, Airflow, SQL, Pandas, Numpy, PostgreSQL, MySQL, ElasticSearch, Kibana, MongoDB, Redis, Looker(Google Data Studio) |
---|---|
Cloud | AWS (EMR, Glue, EC2, RDS, Kinesis, lambda, S3, Athena, Redshift, Opensearch, Elasticache) |
Backend | Python, FastAPI, Flask, Django, BS4, Selenium, Scrapy |
Front-End | HTML/CSS, JavaScript |
ML/DL | Scikit-learn, Tensorflow |
Etc | Git, Linux, Ubuntu, Vim, Docker |