testpage 관리
[AWS] EC2 no space left on device 해결하기 :: Django World
https://djangoworld.tistory.com/17
pikurate test page
TFIDF 테스트 페이지
http://3.36.72.220:8000/tfidf/test/test 가능한 기사 목록
https://www.hani.co.kr/arti/sports/soccer/list1.html
기타
세줄요약기 | 피큐레잇
https://www.pikurate.com/pik/비영리-홍보-실무에-써먹기-좋은-서비스-모음?category=꿀팁&linkId=45140Word2vec - 학습데이터 만들기 (1) : 네이버 블로그
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=gee308&logNo=220868188414데이터전처리 - 나무위키 덤프 텍스트 데이터 얻기
https://velog.io/@nawnoes/%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%A0%84%EC%B2%98%EB%A6%AC-%EB%82%98%EB%AC%B4%EC%9C%84%ED%82%A4-%EB%8D%A4%ED%94%84-%ED%85%8D%EC%8A%A4%ED%8A%B8-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%96%BB%EA%B8%B0미디어위키 API - 제타위키
https://zetawiki.com/wiki/%EB%AF%B8%EB%94%94%EC%96%B4%EC%9C%84%ED%82%A4_API
신문사 홈페이지
천지일보 - 새 시대 희망언론
http://www.newscj.com/아시아투데이
https://www.asiatoday.co.kr/신아일보
http://www.shinailbo.co.kr/내일신문
https://www.naeil.com/대한민국 오후를 여는 유일석간 문화일보 munhwa.com
http://www.munhwa.com/세상을 보는 눈, 글로벌 미디어 - 세계일보 -
https://www.segye.com/국민일보
http://www.kmib.co.kr/news/index.asp한겨레
https://www.hani.co.kr/서울신문
https://www.seoul.co.kr/경향신문
http://www.khan.co.kr/한국일보 : 세상을 보는 균형
https://www.hankookilbo.com/중앙일보 - 현장의 진실을 중앙에 두다.
https://joongang.joins.com/동아닷컴
https://www.donga.com/조선일보 - 1등 디지털뉴스
https://www.chosun.com/
크롤링
뉴스 웹페이지에서 기사 본문 추출에 관한 연구
https://kosim.koar.kr/assets/pdf/414/journal-26-1-305.pdfHTML 본문 추출(Filtering)에 대한 고찰
https://jakarta.tistory.com/76🖨 '웹 크롤러' 좀 그만 만들어라
https://velog.io/@mowinckel/%EC%9B%B9-%ED%81%AC%EB%A1%A4%EB%A7%81-I[Python] 임의의 웹 페이지에서 텍스트를 추출하기
https://bab2min.tistory.com/618
형태소 분석기
한글 NLP with Python
http://incredible.ai/nlp/2016/12/28/NLP/#%ED%98%95%ED%83%9C%EC%86%8C-%EB%B6%84%EC%84%9D-%EB%B9%84%EA%B5%90How to install PyTorch 1.6.0 (conda & pip) - VarHowto
https://varhowto.com/install-pytorch-1-6-0/#4_Steps_to_Install_PyTorch_1_6_0Welcome to PORORO’s documentation! — PORORO: Platform Of neuRal mOdels for natuRal language prOcessing 0.3.1 documentation
https://kakaobrain.github.io/pororo/GitHub - bab2min/kiwipiepy: Python API for Kiwi
https://github.com/bab2min/kiwipiepy꿈 많은 사람의 이야기
https://lsjsj92.tistory.com/410꿈 많은 사람의 이야기
https://lsjsj92.tistory.com/408window mecab 설치방법
https://somjang.tistory.com/entry/Windows-%EC%97%90%EC%84%9C-Mecab-mecab-%EA%B8%B0%EB%B0%98-%ED%95%9C%EA%B5%AD%EC%96%B4-%ED%98%95%ED%83%9C%EC%86%8C-%EB%B6%84%EC%84%9D%EA%B8%B0-%EC%84%A4%EC%B9%98%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95[Python] 한국어 형태소 분석기 체험 및 비교(Okt, Mecab, Komoran, Kkma)
https://soohee410.github.io/compare_tagger한국어 형태소 분석기(POS) 분석 - 3편. 형태소 분석기 비교
https://velog.io/@metterian/%ED%95%9C%EA%B5%AD%EC%96%B4-%ED%98%95%ED%83%9C%EC%86%8C-%EB%B6%84%EC%84%9D%EA%B8%B0POS-%EB%B6%84%EC%84%9D-3%ED%8E%B8.-%ED%98%95%ED%83%9C%EC%86%8C-%EB%B6%84%EC%84%9D%EA%B8%B0-%EB%B9%84%EA%B5%90형태소 분석기 비교
https://passerby14.tistory.com/3[파이썬을 이용한 한글 NLP] 01. 형태소 분석기 : 네이버 블로그
https://m.blog.naver.com/PostView.nhn?blogId=vangarang&logNo=221066229238&proxyReferer=https:%2F%2Fwww.google.com%2F
오픈소스/오픈API
naver_review_classifications_pytorch_kobert.ipynb - Colaboratory
https://colab.research.google.com/github/SKTBrain/KoBERT/blob/master/scripts/NSMC/naver_review_classifications_pytorch_kobert.ipynbswisscom/ai-research-keyphrase-extraction: EmbedRank: Unsupervised Keyphrase Extraction using Sentence Embeddings (official implementation)
https://github.com/swisscom/ai-research-keyphrase-extractionpranav-ust/BERT-keyphrase-extraction: Keyphrase Extraction based on Scientific Text, Semeval 2017, Task 10
https://github.com/pranav-ust/BERT-keyphrase-extractionibatra / BERT-Keyword-Extractor : BERT를 사용한 심층 키 프레이즈 추출
https://github.com/ibatra/BERT-Keyword-ExtractorMaartenGr/KeyBERT: Minimal keyword extraction with BERT
https://github.com/MaartenGr/KeyBERTAmazon Comprehend – 기능
https://aws.amazon.com/ko/comprehend/features/
algorithm 개념
한글 문서의 단어 동시 출현 정보에 개선된 TextRank를 적용한 키워드 자동 추출 기법 - 한국어정보학회 학술대회 - 한국어정보학회 : 논문 - DBpia, 연구를 돕는 똑똑한 학술콘텐츠 플랫폼
http://lps3.www.dbpia.co.kr.libproxy.dgist.ac.kr/journal/articleDetail?nodeId=NODE09474797의존관계를 이용한 단일문서의 키워드 추출 - 한국정보과학회 학술발표논문집 - 한국정보과학회 : 논문 - DBpia, 연구를 돕는 똑똑한 학술콘텐츠 플랫폼
http://lps3.www.dbpia.co.kr.libproxy.dgist.ac.kr/journal/articleDetail?nodeId=NODE01219119Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 - 한국전자거래학회지 - 한국전자거래학회 : 논문 - DBpia, 연구를 돕는 똑똑한 학술콘텐츠 플랫폼
http://lps3.www.dbpia.co.kr.libproxy.dgist.ac.kr/journal/articleDetail?nodeId=NODE07451610#noneJAKO201819063369839.pdf
http://koreascience.or.kr/article/JAKO201819063369839.pdfc01.dvi
https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.657.8134&rep=rep1&type=pdf[Text mining] RAKE(Rapid Automatic Keyword Extraction) Algorithm :: Cara's Moving
https://pongdangstory.tistory.com/368BERT를 사용한 키워드 추출
https://ichi.pro/ko/bertleul-sayonghan-kiwodeu-chuchul-125683571626730Machine Translation Survey (vol1) : Background - YouTube
https://www.youtube.com/watch?v=KQfvEg-fGMw