디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

헌재게시판 여론 탄핵 반대: 1997, 탄핵 찬성: 82앱에서 작성

야갤러(106.102) 2024.12.19 18:59:24
조회 78 추천 0 댓글 0

import requests

from bs4 import BeautifulSoup

import transformers

import torch

from transformers import BertTokenizer, BertForSequenceClassification, Trainer, TrainingArguments

from datasets import Dataset


train_data = {

'text': [

"탄핵반대 ! 생중계 찬성", "탄핵 결사 반대!!!!", "대통령 탄핵반대 재판 생중계 요청",

"탄핵 반대 생중계하라", "생중계", "탄핵 반대 탄핵찬성하는놈들 CIA 신고하자. 미국 못 간다.",

"윤석열대통령 탄핵반대", "간첩때려잡자", "탄핵 반대 내란죄는 국정을 마비시킨 민주당이다",

"존경하는 6인 재판관님 선거조작 선관위수사를 막지 마세요[탄핵기각]생중계촉구", "탄핵무효",

"존경하는 재판관님 탄핵찬성입니다", "탄핵 찬성입니다", "찬성합니다", "탄핵 찬성합니다.",

"내란수/괴 독재자 사형 탄핵!!!!!!!", "토종한국인은 윤정은의 탄핵 찬성"

],

'labels': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1]

}


# Prepare the dataset

train_dataset = Dataset.from_dict(train_data)


# Load pre-trained KoBERT model and tokenizer

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') # Check if GPU is available

tokenizer = BertTokenizer.from_pretrained('kykim/bert-kor-base')

model = BertForSequenceClassification.from_pretrained('kykim/bert-kor-base', num_labels=2).to(device) # Move model to GPU


# Tokenize the dataset

def tokenize_function(examples):

return tokenizer(examples['text'], padding='max_length', truncation=True)


train_dataset = train_dataset.map(tokenize_function, batched=True)


# Training arguments

training_args = TrainingArguments(

output_dir='./results',

num_train_epochs=3,

per_device_train_batch_size=8,

evaluation_strategy="no",

logging_dir='./logs',

logging_steps=10,

)


# Trainer setup

trainer = Trainer(

model=model,

args=training_args,

train_dataset=train_dataset,

)


# Fine-tuning the model

trainer.train()


# Base URL for the site


anti_count = 0

pro_count = 0

# Initialize a list to store the last 10 titles

recent_titles = []


# Example function for classification

def classify_title(title):

inputs = tokenizer(title, return_tensors="pt", truncation=True, padding=True, max_length=128).to(device) # Move inputs to GPU

with torch.no_grad():

outputs = model(**inputs)

prediction = torch.argmax(outputs.logits, dim=-1).item()

return "찬성" if prediction == 1 else "반대"


# Loop through the first 1000 pages

for page in range(1, 1001):

if (page % 10) == 0:

print(f"{page}페이지까지 분석 | 탄핵 반대: {anti_count}, 탄핵 찬성: {pro_count}")

url = base_url.format(page)

response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')


# Find all rows containing title

rows = soup.select('table tbody tr')


# Extract and count titles

for row in rows:

title = row.select_one('td:nth-child(2)').text.strip()


# Skip the title if it matches any of the last 10 titles

if title in recent_titles:

# print("중복된 title 무시")

continue

# Add the current title to the list of recent titles

recent_titles.append(title)

if len(recent_titles) > 10:

recent_titles.pop(0) # Remove the oldest title if we have more than 10


label = classify_title(title)

if label == "반대":

anti_count += 1

elif label == "찬성":

pro_count += 1


print(f"탄핵 반대: {anti_count}, 탄핵 찬성: {pro_count}")

​실명 인증 든든하다 ㅋㅋㅋㅋ

- dc official App

추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 2024년 가장 기억에 남는 인터넷 이슈는? 운영자 24/12/23 - -
16093257 엠바고 뭐임 야갤러(14.51) 03:05 61 0
16093256 원래 시내 옷가게 호구 잘잡히냐? [2] ㅇㅇ(117.111) 03:05 61 2
16093255 한남충<-이거 왤케 입에 촥촥 감기냐 ㅇㅇ(118.235) 03:05 112 2
16093251 추천누르고 댓글달아 야갤러(218.146) 03:04 206 2
16093250 아 다시 물어봤는데 3시 반이래 쏘리쏘리 [3] ㅇㅇ(110.35) 03:04 276 1
16093249 그래도 그녀에게 마음을전해서 속이후련하다.. [11] ㅂㅅㅂㅅㅂㅅ갤로그로 이동합니다. 03:04 280 3
16093247 귀여우면 개추 홀란드(211.116) 03:04 415 7
16093244 개년보다 생각났느데 여자아이들이란 그룹이 있으면 ㅇㅇ(118.235) 03:04 86 0
16093241 형 사진 최초공개 [1] 나그네(106.101) 03:03 673 11
16093240 하얗지?? 야갤러(211.234) 03:03 343 1
16093239 헌터헌터<<<데스노트보다 재밌음 [3] 야갤러(106.101) 03:03 165 0
16093237 하고싶은것과 할수있는것.. 스쿠마갤로그로 이동합니다. 03:03 206 0
16093234 민주당이 간첩집단인게 확실한 이유 Mimi갤로그로 이동합니다. 03:03 169 0
16093232 사촌동생ㅁㅌㅊ? 음바페(211.116) 03:03 397 0
16093231 윈터: 잠온다 ㅇㅇ(211.235) 03:03 268 0
16093230 나 이제 잘건데 인사해 [6] 빈티지야순이갤로그로 이동합니다. 03:03 338 3
16093229 스시녀와 김치녀는 품질부터가 다름 야갤러(129.97) 03:02 101 1
16093227 개추시 꿈속에서 짤녀한테 착정당함 야갤러(218.146) 03:02 586 53
16093226 3시에 정확히 오는게 아니라 당연히 오차가 있지 ㅇㅇ(110.35) 03:02 263 1
16093225 야붕이의 고양이자세긔 [1] 밑바닥탈출갤로그로 이동합니다. 03:02 283 1
16093224 브금으로 마음 편안해지면 개추ㅋㅋ ㅇㅇ(175.206) 03:02 180 1
16093220 잠온다 [6] 빈티지야순이갤로그로 이동합니다. 03:01 393 0
16093219 한남충의 성욕은 왜이리 강한걸까 [1] ㅇㅇ(118.235) 03:01 332 3
16093218 ㅁㅊ 속보 떴네 야갤러(110.10) 03:01 190 0
16093217 3시에 오긴 뭐가와 씨발련들아 야갤러(118.235) 03:01 117 0
16093216 개추시 짤녀가 결혼 해줌 음바페(211.116) 03:01 334 1
16093214 본인 크리스마스 전쟁대비 생수 144L 사놨음ㅇㅇ ㅇㅇ(223.62) 03:01 264 0
16093212 스시녀는 왜 아름다울까 [3] 야갤러(129.97) 03:00 80 1
16093208 편의점 점주인데 여고딩알바가 [2] ㅇㅇ갤로그로 이동합니다. 03:00 311 0
16093206 야순이 몸매 ㅇㅇ(116.120) 03:00 581 3
16093205 야순이 발바닥 ㅇㅇ(182.228) 02:59 415 0
16093204 솔까 편의점알바만해도 굶어죽을일은 없긴 함 [3] 스쿠마갤로그로 이동합니다. 02:59 235 0
16093201 야순이 목욕탕 [1] 빈티지야순이갤로그로 이동합니다. 02:59 447 0
16093198 솔까 지금 민주당 천하 만든건 다 보수세력 덕분임 [2] 야갤러(39.119) 02:59 193 2
16093197 전쟁드립 노잼이야 씨발아 ㅇㅇ(110.35) 02:59 189 0
16093196 나 일본인 여자친구 생겼는데 야갤러(106.102) 02:59 308 3
16093195 야순이 셀카 찍어봄 [4] ㅇㅇ(211.197) 02:59 759 15
16093193 야갤하면서 혐짤 한번도 안본거는 처음이네 ㅋㅋㅋㅋㅋㅋ [1] 야갤러(59.2) 02:58 364 5
16093191 크리스마스날 레알 전쟁남??ㅇㅇ [1] ㅇㅇ(223.62) 02:58 314 0
16093190 편돌이인데 지금 콘좀 존나팔리네…하 ㅇㅇ(118.235) 02:58 159 4
16093187 d13974 ㅇㅇ(114.207) 02:58 109 0
16093186 개추시 행복해짐 야갤러(218.146) 02:58 482 45
16093184 뮌헨의 마에스트로 ㅇㅇ(211.49) 02:58 223 0
16093183 야짤 많이올라오는 갤러리 추천점 [1] 야갤러(220.80) 02:58 136 0
16093182 신인 배우 어떰? ㅇㅇ(211.197) 02:58 446 6
16093181 내년 이 날에는 반드시 기필코 섹스한다 [1] ㅇㅇ(121.157) 02:58 264 4
16093176 여자가 남자 강간하는 존나 하드하면서 꼴리는물 없음? 야갤러(118.235) 02:57 271 2
16093175 개구리녀 주면 먹는다 개추 [2] ㅇㅇ(124.51) 02:57 605 7
16093174 니네 한국좌파 뭣도 모르면서 추종하잖아?! ㅋㅋㅋ ㅇㅇ(211.235) 02:57 87 1
16093171 강제피스팅 [1] ㅇㅇ(118.235) 02:56 429 2
뉴스 [단독] ‘독설가’ 김구라, ‘썰전’ MC 그대로 맡는다 디시트렌드 12.23
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2