Question 1

Laddas mitt ljud upp till en server?

Accepted Answer

Transkriberingen körs 100% lokalt i din webbläsare. Därefter kan du välja att dela ljud och transkription med oss (samtyckeskryssruta) för att förbättra tjänsten — helt frivilligt.

Question 2

Vilka ljudformat stöds?

Accepted Answer

MP3, WAV, M4A, OGG, FLAC, WEBM, MP4, MOV och alla format som din webbläsare kan avkoda.

Question 3

Hur lång får min ljudfil vara?

Accepted Answer

Upp till 10 minuter per fil i gratisläge. För längre ljud stöder Premium upp till 10 timmar.

Question 4

Vilka språk stöds?

Accepted Answer

Whisper-modellen stöder 99 språk, inklusive svenska, engelska, portugisiska, spanska, franska, tyska, japanska, arabiska och många fler. Identifiering är automatisk.

Question 5

Behöver jag installera något?

Accepted Answer

Nej. Det fungerar direkt i webbläsaren. AI-modellen (~40MB) laddas ned en gång och lagras i cache.

Question 6

Sparas transkriptionen någonstans?

Accepted Answer

Som standard, nej — resultatet stannar i din webbläsare. Om du markerar samtyckesrutan skickas ljud och transkription till våra servrar och raderas efter 7 dagar. Du kan återkalla ditt samtycke när som helst.

Question 7

Vad är skillnaden mot Premium?

Accepted Answer

Gratisläget använder VoxScriber Nano (4-bitars kvantiserad, q4) lokalt: 10 min gräns, ~85% noggrannhet, ingen högtalaridentifiering, tidsstämplar bara på segmentnivå (~30s). Premium använder molnmodeller (AssemblyAI + Whisper Large float32): >95% noggrannhet, identifiering upp till 30 talare, tidsstämplar per ord, filer upp till 10h, MP4/MOV/MKV-videostöd och export till DOCX/PDF/JSON. Hastighet: 1h ljud tar ~20min på din lokala CPU vs ~2min på Premiums GPU.

Question 8

Fungerar det på mobil?

Accepted Answer

Ja, men prestandan beror på din enhet. På smartphones med lite RAM kan transkriberingen vara långsammare.

Question 9

Är det verkligen gratis?

Accepted Answer

Ja. Webbläsartranskriberaren är helt gratis utan provperiod, vattenstämpel eller registrering. Vi tjänar pengar på Premium-molnplanerna, inte på det fria verktyget.

Question 10

Lämnar mitt ljud min enhet?

Accepted Answer

Nej — transkriberingen körs lokalt via WebAssembly. Det enda undantaget är om du uttryckligen markerar den valfria samtyckeskryssrutan för att dela en inspelning med oss.

Question 11

Finns det en filstorleksgräns?

Accepted Answer

Den praktiska gränsen är längd (10 minuter per fil) och din enhets minne, inte megabyte. En 10-minuters MP3 är vanligtvis 10-20 MB och fungerar bra på de flesta enheter.

Question 12

Hur lång tid tar transkriberingen?

Accepted Answer

Med Nano-modellen, förvänta dig ungefär 1-2 gånger ljudets längd på en modern bärbar dator — en 5-minuters fil tar cirka 5-10 minuter. Första körningen lägger till en engångsnedladdning av modellen på ~40 MB.

Question 13

Kan jag exportera undertexter (SRT)?

Accepted Answer

Ja — gratis export inkluderar .txt, .srt och .vtt med segmenttidsstämplar. För tidsstämplar på ordnivå och DOCX/PDF/JSON-export, se Premium.

Question 14

Kan jag transkribera flera filer samtidigt?

Accepted Answer

Ja — du kan köa upp till 5 filer och de bearbetas en efter en i din webbläsare. Premium tar bort kögränsen och bearbetar filer parallellt i molnet.

Question 15

Varför tar den första transkriberingen längre tid?

Accepted Answer

Vid ditt första besök laddas AI-modellen ner och kompileras av din webbläsare. Den cachas sedan, så varje senare transkribering startar omedelbart.

Question 16

Fungerar det offline?

Accepted Answer

Delvis — när modellen är cachad behöver transkriberingen ingen anslutning. Du måste fortfarande vara online för att ladda sidan.

Question 17

Skriver den tontecken korrekt?

Accepted Answer

Ja — fulla vietnamesiska diakritiska tecken produceras; tillfälliga tonförväxlingar förekommer i brusig ljud.

Question 18

Nordlig eller sydlig accent?

Accepted Answer

Båda fungerar; nordligt uttal är något mer korrekt.

Question 19

Kan jag transkribera Zalo-röstmeddelanden?

Accepted Answer

Ja — spara ljudfilen och släpp den här.

	Gratis (webbläsare)	Premium (moln)
Filgräns	10 min	10 horas
Noggrannhet	~85%	>95%
Högtalaridentifiering	❌	✅
Tidsstämplar per ord	❌	✅
Videostöd (MP4/MOV)	❌	✅
Exportformat	TXT, SRT, VTT	DOCX, PDF, JSON…
Hastighet (1h ljud)	~2 min / 1h	~2 min / 1h
Integritet	100% local	☁️ + 🔒

Gratis Vietnamesiska ljudtranskribering i din webbläsare

Lokal AI

Snabbt och lokalt

99 språk

Ingen registrering

How it works

Ladda upp eller spela in ljud

AI körs på din enhet

Kopiera eller ladda ned texten

Hur bra hanterar Whisper Vietnamesiska?

Var Vietnamesiska-ljud vanligtvis kommer ifrån

Hur noggrann är webbläsartranskribering?

Webbläsare vs molntranskribering: vilken behöver du?

Ljudformat som stöds

Behöver du mer? Prova Premium

Högtalaridentifiering

Filer upp till 10 timmar

Sammanfattning, sentiment & ämnen

Fullständiga exportalternativ

FAQ