FMUSER वायुहीन प्रसारण वीडियो और ऑडियो अधिक आसान!

[ईमेल संरक्षित] WhatsApp + 8618078869184
भाषा

    ऑडियो प्रोसेसिंग -1 बुनियादी ज्ञान

     

    ऑडियो


    20 हर्ट्ज और 20 किलोहर्ट्ज़ के बीच ध्वनि आवृत्ति के साथ ध्वनि तरंगों को संदर्भित करता है जिसे मानव कान द्वारा सुना जा सकता है।

    यदि आप कंप्यूटर में एक संबंधित ऑडियो कार्ड जोड़ते हैं - ध्वनि कार्ड जिसे हम अक्सर कहते हैं, हम सभी ध्वनियों को रिकॉर्ड कर सकते हैं, और ध्वनि की ध्वनिक विशेषताओं, जैसे कि ध्वनि का स्तर, कंप्यूटर की हार्ड पर फ़ाइलों के रूप में संग्रहीत किया जा सकता है डिस्क। इसके विपरीत, हम पहले से रिकॉर्ड किए गए ध्वनि को पुनर्स्थापित करने के लिए संग्रहीत ऑडियो फ़ाइल को चलाने के लिए एक निश्चित ऑडियो प्रोग्राम का भी उपयोग कर सकते हैं।

     

    1 ऑडियो फ़ाइल स्वरूप
    ऑडियो फ़ाइल प्रारूप विशेष रूप से ऑडियो डेटा संग्रहीत फ़ाइल के प्रारूप को संदर्भित करता है। कई अलग-अलग प्रारूप हैं।

    ऑडियो डेटा प्राप्त करने की सामान्य विधि ऑडियो वोल्टेज को एक निश्चित समय अंतराल पर नमूना करना (निर्धारित करना) है, और परिणाम को एक निश्चित रिज़ॉल्यूशन पर संग्रहीत करना है (उदाहरण के लिए, सीडीडीए का प्रत्येक नमूना 16 बिट्स या 2 बाइट्स है)। नमूने के अंतराल में अलग-अलग मानक हो सकते हैं। उदाहरण के लिए, सीडीडीए प्रति सेकंड 44,100 बार उपयोग करता है; डीवीडी प्रति सेकंड 48,000 या 96,000 बार उपयोग करता है। इसलिए, [नमूना दर], [संकल्प] और [चैनलों की संख्या] (उदाहरण के लिए, स्टीरियो के लिए 2 चैनल) ऑडियो फ़ाइल प्रारूप के प्रमुख पैरामीटर हैं।

     

    १.१ हानि और दोषरहित होना
    डिजिटल ऑडियो की उत्पादन प्रक्रिया के अनुसार, ऑडियो कोडिंग केवल असीम रूप से प्राकृतिक संकेतों के करीब हो सकती है। कम से कम वर्तमान तकनीक तो यही कर सकती है। कोई भी डिजिटल ऑडियो कोडिंग योजना नुकसानदेह है क्योंकि इसे पूरी तरह से बहाल नहीं किया जा सकता है। कंप्यूटर अनुप्रयोगों में, निष्ठा का उच्चतम स्तर पीसीएम एन्कोडिंग है, जो व्यापक रूप से सामग्री संरक्षण और संगीत प्रशंसा के लिए उपयोग किया जाता है। इसका उपयोग सीडी, डीवीडी और हमारी सामान्य WAV फ़ाइलों में किया जाता है। इसलिए, पीसीएम सम्मेलन द्वारा दोषरहित एन्कोडिंग बन गया है, क्योंकि पीसीएम डिजिटल ऑडियो में सर्वश्रेष्ठ निष्ठा स्तर का प्रतिनिधित्व करता है।

     

    ऑडियो फ़ाइल स्वरूपों के दो मुख्य प्रकार हैं:

    दोषरहित प्रारूप, जैसे WAV, PCM, TTA, FLAC, AU, APE, TAK, WavPack (WV)
    हानिपूर्ण प्रारूप, जैसे एमपी 3, विंडोज मीडिया ऑडियो (डब्ल्यूएमए), ओग वोरबिस (ओजीजी), एएसी

     


    2 पैरामीटर परिचय


    2.1 नमूना दर


    प्रति सेकंड प्राप्त ध्वनि नमूनों की संख्या का संदर्भ देता है। ध्वनि वास्तव में एक प्रकार की ऊर्जा तरंग है, इसलिए इसमें आवृत्ति और आयाम की विशेषताएं भी होती हैं। आवृत्ति समय अक्ष से मेल खाती है और आयाम स्तर अक्ष से मेल खाती है। लहर असीम रूप से चिकनी है, और स्ट्रिंग को अनगिनत बिंदुओं से बना माना जा सकता है। क्योंकि भंडारण स्थान अपेक्षाकृत सीमित है, स्ट्रिंग के बिंदुओं को डिजिटल एन्कोडिंग प्रक्रिया के दौरान नमूना किया जाना चाहिए।

     

    नमूनाकरण प्रक्रिया एक निश्चित बिंदु के आवृत्ति मूल्य को निकालने के लिए है। जाहिर है, एक सेकंड में अधिक अंक निकाले जाते हैं, अधिक आवृत्ति जानकारी प्राप्त की जाती है। तरंग को बहाल करने के लिए, नमूना आवृत्ति जितनी अधिक होगी, ध्वनि की गुणवत्ता बेहतर होगी। बहाली जितनी वास्तविक है, लेकिन एक ही समय में यह अधिक संसाधनों पर कब्जा कर लेता है। मानव कान के सीमित संकल्प के कारण, बहुत अधिक आवृत्ति को प्रतिष्ठित नहीं किया जा सकता है। 22050 का नमूना आवृत्ति आमतौर पर उपयोग किया जाता है, 44100 पहले से ही सीडी ध्वनि की गुणवत्ता है, और 48,000 या 96,000 से अधिक का नमूना मानव कान के लिए अब सार्थक नहीं है। यह फिल्मों में प्रति सेकंड 24 फ्रेम के समान है। यदि यह स्टीरियो है, तो नमूना दोगुना है और फ़ाइल लगभग दोगुनी है।

     

    Nyquist नमूना सिद्धांत के अनुसार, यह सुनिश्चित करने के लिए कि ध्वनि विकृत नहीं है, नमूना आवृत्ति लगभग 40kHz होनी चाहिए। हमें यह जानने की जरूरत नहीं है कि यह प्रमेय कैसे आया। हमें केवल यह जानने की जरूरत है कि यह प्रमेय हमें बताता है कि यदि हम किसी सिग्नल को सटीक रूप से रिकॉर्ड करना चाहते हैं, तो हमारी नमूना आवृत्ति ऑडियो सिग्नल की अधिकतम आवृत्ति से दोगुनी या उसके बराबर होनी चाहिए। याद रखें, यह अधिकतम आवृत्ति है।

     

    डिजिटल ऑडियो के क्षेत्र में, आमतौर पर उपयोग किए जाने वाले नमूने दर हैं:

    8000 हर्ट्ज-सैंपलिंग दर फोन द्वारा उपयोग किया जाता है, जो मानव भाषण के लिए पर्याप्त है
    फोन द्वारा उपयोग किया गया 11025 हर्ट्ज-सैंपलिंग दर
    रेडियो प्रसारण में 22050 हर्ट्ज-सैंपलिंग दर
    32000 हेज़-सैंपलिंग दर, मिनीडीवी डिजिटल वीडियो कैमकॉर्डर, डीएटी (एलपी मोड) के लिए
    44100 हर्ट्ज-ऑडियो सीडी, आमतौर पर एमपीईजी -1 ऑडियो (वीसीडी, एसवीसीडी, एमपी 3) के लिए नमूना दर के रूप में भी इस्तेमाल किया जाता है
    47250 हर्ट्ज-सैंपलिंग दर जिसका उपयोग वाणिज्यिक PCM रिकार्डर द्वारा किया जाता है
    मिनी डीवीडी, डिजिटल टीवी, डीवीडी, डीएटी, फिल्मों, और पेशेवर ऑडियो में इस्तेमाल डिजिटल ध्वनि के लिए 48000 हर्ट्ज-नमूनाकरण दर
    वाणिज्यिक डिजिटल रिकार्डर द्वारा 50000 हर्ट्ज-सैंपलिंग दर का उपयोग किया जाता है
    96000 हर्ट्ज या 192000 हर्ट्ज-नमूना दर डीवीडी-ऑडियो के लिए उपयोग किया जाता है, कुछ एलपीसीएम डीवीडी ऑडियो ट्रैक, बीडी-रोम (ब्लू-रे डिस्क) ऑडियो ट्रैक, और एचडी-डीवीडी (हाई डेफिनिशन डीवीडी) ऑडियो ट्रैक्स


    २.२ सैंपलिंग बिट्स की संख्या
    नमूनाकरण बिट्स की संख्या को नमूना आकार या परिमाणीकरण बिट्स की संख्या भी कहा जाता है। यह ध्वनि के उतार-चढ़ाव को मापने के लिए उपयोग किया जाने वाला एक पैरामीटर है, अर्थात, साउंड कार्ड का रिज़ॉल्यूशन या साउंड कार्ड द्वारा संसाधित साउंड कार्ड के रिज़ॉल्यूशन के रूप में समझा जा सकता है। बड़ा मूल्य, उच्च रिज़ॉल्यूशन, और अधिक यथार्थवादी ध्वनि रिकॉर्ड और वापस खेली गई। साउंड कार्ड का बिट, साउंड कार्ड द्वारा उपयोग किए जाने वाले डिजिटल साउंड सिग्नल के द्विआधारी अंकों को संदर्भित करता है जब ध्वनि फ़ाइलों को इकट्ठा करना और खेलना होता है। साउंड कार्ड का थोड़ा सा उद्देश्य डिजिटल साउंड सिग्नल के इनपुट साउंड सिग्नल के विवरण की सटीकता को दर्शाता है। सामान्य साउंड कार्ड मुख्य रूप से 8-बिट और 16-बिट होते हैं। आजकल, बाजार पर सभी मुख्यधारा के उत्पाद 16-बिट और साउंड कार्ड से ऊपर हैं।

     

    प्रत्येक सैंपल किए गए डेटा का आयाम रिकॉर्ड होता है, और सैंपलिंग सटीकता नमूना बिट्स की संख्या पर निर्भर करता है:

    1 बाइट (यानी, 8 बिट) केवल 256 संख्याओं को रिकॉर्ड कर सकता है, जिसका अर्थ है कि आयाम को केवल 256 स्तरों में विभाजित किया जा सकता है;
    2 बाइट्स (यानी, 16 बिट) 65536 के रूप में छोटा हो सकता है, जो पहले से ही सीडी मानक है;
    4 बाइट्स (यानी, 32 बिट) आयाम को 4294967296 स्तरों में घटा सकते हैं, जो वास्तव में अनावश्यक है।
    2.3 चैनलों की संख्या
    यानी साउंड चैनल की संख्या। आम मोनो और स्टीरियो (डुअल-चैनल) अब चार-साउंड सराउंड (चार-चैनल) और 5.1 चैनलों के लिए विकसित हो गए हैं।

     

    2.3.1 मोनो
    मोनो ध्वनि प्रजनन का एक अपेक्षाकृत आदिम रूप है, और शुरुआती साउंड कार्ड इसका अधिक सामान्यतः उपयोग करते हैं। मोनो साउंड को केवल एक स्पीकर का उपयोग करके देखा जा सकता है, और कुछ को एक ही साउंड चैनल को आउटपुट करने के लिए दो स्पीकर में भी संसाधित किया जाता है। जब मोनोफोनिक जानकारी को दो वक्ताओं के माध्यम से वापस खेला जाता है, तो हम स्पष्ट रूप से महसूस कर सकते हैं कि ध्वनि दो वक्ताओं से है। ध्वनि स्रोत के विशिष्ट स्थान को निर्धारित करना असंभव है जो स्पीकर के मध्य से हमारे कानों में प्रसारित होता है।

     

    2.3.2 स्टीरियो
    बीनायुरल चैनलों में दो साउंड चैनल होते हैं। सिद्धांत यह है कि जब लोग एक ध्वनि सुनते हैं, तो वे बाएं और दाएं कान के बीच के अंतर के आधार पर ध्वनि स्रोत की विशिष्ट स्थिति का न्याय कर सकते हैं। रिकॉर्डिंग प्रक्रिया के दौरान ध्वनि को दो स्वतंत्र चैनलों को आवंटित किया जाता है, ताकि एक अच्छा ध्वनि स्थानीयकरण प्रभाव प्राप्त किया जा सके। यह तकनीक संगीत की प्रशंसा में विशेष रूप से उपयोगी है। श्रोता स्पष्ट रूप से उस दिशा को अलग कर सकता है जिसमें से विभिन्न उपकरण आते हैं, जो संगीत को अधिक कल्पनाशील और ऑन-साइट अनुभव के करीब बनाता है।

     

    दो आवाज वर्तमान में सबसे अधिक उपयोग की जाती हैं। कराओके में, एक संगीत बजाने के लिए है और दूसरा गायक की आवाज़ के लिए है; वीसीडी में, एक मंदारिन में डबिंग कर रहा है और दूसरा कैंटोनीज़ में डबिंग कर रहा है।

     

    2.3.3 फोर-टोन सराउंड
    फोर-चैनल सराउंड चार साउंडिंग पॉइंट्स को परिभाषित करता है, फ्रंट लेफ्ट, फ्रंट राइट, रियर लेफ्ट और रियर राइट, और दर्शक इनसे घिरा हुआ है। कम-आवृत्ति संकेतों के प्लेबैक प्रसंस्करण को मजबूत करने के लिए एक सबवूफर जोड़ने की भी सिफारिश की गई है (यही कारण है कि 4.1-चैनल स्पीकर सिस्टम आज व्यापक रूप से लोकप्रिय हैं)। जहां तक ​​समग्र प्रभाव का सवाल है, चार-चैनल प्रणाली कई अलग-अलग दिशाओं से श्रोताओं को घेर सकती है, विभिन्न प्रकार के वातावरण में होने का श्रवण अनुभव प्राप्त कर सकती है और उपयोगकर्ताओं को एक नया अनुभव दे सकती है। आजकल, चार-चैनल प्रौद्योगिकी को व्यापक रूप से विभिन्न मध्य-से-उच्च अंत साउंड कार्ड के डिजाइन में एकीकृत किया गया है, जो भविष्य के विकास की मुख्य धारा बन गया है।

     

    २ ० चैनल
    5.1 चैनल व्यापक रूप से विभिन्न पारंपरिक थिएटर और होम थिएटर में उपयोग किए गए हैं। अधिक प्रसिद्ध ध्वनि रिकॉर्डिंग संपीड़न प्रारूपों में से कुछ, जैसे डॉल्बी एसी -3 (डॉल्बी डिजिटल), डीटीएस, आदि, 5.1 ध्वनि प्रणाली पर आधारित हैं। ".1" चैनल एक विशेष रूप से डिज़ाइन किया गया सबवूफ़र चैनल है जो 20 से 120 हर्ट्ज की आवृत्ति प्रतिक्रिया रेंज के साथ सबवूफ़र्स का उत्पादन कर सकता है। वास्तव में, 5.1 साउंड सिस्टम 4.1 सराउंड से आता है, अंतर यह है कि यह एक केंद्र इकाई को जोड़ता है। यह केंद्र इकाई 80Hz से नीचे ध्वनि संकेत संचारित करने के लिए जिम्मेदार है, जो फिल्म देखते समय मानव आवाज को मजबूत करने में सहायक है, और समग्र प्रभाव को बढ़ाने के लिए पूरे ध्वनि क्षेत्र के मध्य में संवाद को केंद्रित करता है।

     

    वर्तमान में, QQ Music जैसे कई ऑनलाइन संगीत खिलाड़ियों ने ट्रायल सुनने और डाउनलोड करने के लिए 5.1-चैनल संगीत प्रदान किया है।

     

    एक्सएनएनएक्स फ्रेम
    ऑडियो फ्रेम की अवधारणा वीडियो फ्रेम की तरह स्पष्ट नहीं है। लगभग सभी वीडियो एन्कोडिंग प्रारूप बस एक एन्कोडेड छवि के रूप में एक फ्रेम के बारे में सोच सकते हैं। हालाँकि, ऑडियो फ़्रेम एन्कोडिंग प्रारूप से संबंधित है, जिसे प्रत्येक एन्कोडिंग मानक द्वारा कार्यान्वित किया जाता है।

     

    उदाहरण के लिए, पीसीएम (अनएन्कोडेड ऑडियो डेटा) के मामले में, इसे फ्रेम की अवधारणा की बिल्कुल भी आवश्यकता नहीं है, और इसे नमूना दर और नमूना सटीकता के अनुसार खेला जा सकता है। उदाहरण के लिए, 44.1kHZ की नमूना दर और 16 बिट्स की एक नमूना सटीकता के साथ दोहरे ऑडियो के लिए, आप गणना कर सकते हैं कि बिट दर 44100162bps है, और प्रति सेकंड ऑडियो डेटा एक निश्चित 44100162/8 बाइट्स है।

     

    Amr फ्रेम अपेक्षाकृत सरल है। यह निर्धारित करता है कि प्रत्येक 20ms ऑडियो एक फ्रेम है, और ऑडियो का प्रत्येक फ्रेम स्वतंत्र है, और विभिन्न एन्कोडिंग एल्गोरिदम और विभिन्न एन्कोडिंग मापदंडों का उपयोग करना संभव है।

     

    एमपी 3 फ्रेम थोड़ा अधिक जटिल है और इसमें नमूना दर, बिट दर और विभिन्न मापदंडों जैसे अधिक जानकारी शामिल है।

     

    2.5 चक्र
    एक समय में प्रसंस्करण के लिए एक ऑडियो डिवाइस द्वारा आवश्यक फ़्रेमों की संख्या, और ऑडियो डिवाइस का डेटा एक्सेस और ऑडियो डेटा का भंडारण सभी इस इकाई पर आधारित हैं।

     

    2.6 इंटरलेव्ड मोड
    डिजिटल ऑडियो सिग्नल की भंडारण विधि। डेटा को निरंतर फ़्रेम में संग्रहीत किया जाता है, अर्थात, बाएं चैनल नमूने और फ़्रेम 1 के दाएं चैनल नमूने पहले रिकॉर्ड किए जाते हैं, और फिर फ़्रेम 2 की रिकॉर्डिंग शुरू की जाती है।

     

    2.7 गैर-इंटरलेस्ड मोड
    सबसे पहले, एक अवधि में सभी फ़्रेमों के बाएं चैनल नमूने रिकॉर्ड करें, और फिर सभी सही चैनल नमूने रिकॉर्ड करें।

     

    2.8 बिट दर (बिट दर)
    बिट दर को बिट रेट भी कहा जाता है, जो प्रति सेकंड संगीत द्वारा बजाए जाने वाले डेटा की मात्रा को संदर्भित करता है। इकाई बिट द्वारा व्यक्त की जाती है, जो बाइनरी बिट है। बीपीएस बिट दर है। बी बिट (बिट) है, एस दूसरा (दूसरा) है, पी हर (प्रति) है, एक बाइट 8 बाइनरी बिट के बराबर है। कहने का तात्पर्य यह है कि, 4 एमबीपीएस के 128-मिनट के गाने की फ़ाइल का आकार इस तरह (128/8) 460 = 3840kB = 3.8MB, 1B (बाइट) = 8b (बिट) की गणना की जाती है, आम तौर पर mp3 लगभग 128 बिट पर फायदेमंद होता है दर, और यह संभवत: आकार 3-4 बीएम के आसपास है।

     

    कंप्यूटर अनुप्रयोगों में, उच्चतम स्तर की निष्ठा पीसीएम एन्कोडिंग है, जिसका व्यापक रूप से उपयोग किया जाता है सामग्री संरक्षण और संगीत प्रशंसा के लिए। सीडी, डीवीडी और हमारी सामान्य डब्ल्यूएवी फाइलें सभी उपयोग की जाती हैं। इसलिए, पीसीएम कन्वेंशन द्वारा एक दोषरहित एन्कोडिंग बन गया है, क्योंकि पीसीएम डिजिटल ऑडियो में सबसे अच्छा फ़िडेलिटी स्तर का प्रतिनिधित्व करता है। इसका मतलब यह नहीं है कि पीसीएम सिग्नल की पूर्ण निष्ठा सुनिश्चित कर सकता है। पीसीएम केवल अधिकतम अनंत निकटता प्राप्त कर सकता है।

     

    एक पीसीएम ऑडियो स्ट्रीम की बिट दर की गणना करने के लिए एक बहुत ही आसान काम है, नमूना दर मूल्य × नमूना आकार मूल्य × चैनल संख्या बीपीएस। 44.1KHz के नमूने की दर के साथ एक WAV फ़ाइल, 16bit का एक नमूना आकार और दोहरे चैनल PCM एन्कोडिंग, इसकी डेटा दर 44.1K × 16 × 2 = 1411.2Kbps है। हमारी आम ऑडियो सीडी पीसीएम एन्कोडिंग का उपयोग करती है, और एक सीडी की क्षमता केवल 72 मिनट की संगीत जानकारी रख सकती है।

     

    एक दोहरे चैनल PCM एन्कोडेड ऑडियो सिग्नल को 176.4 सेकंड में 1KB और 10.34 मिनट में लगभग 1M स्पेस की आवश्यकता होती है। यह अधिकांश उपयोगकर्ताओं के लिए अस्वीकार्य है, खासकर उन लोगों के लिए जो कंप्यूटर पर संगीत सुनना पसंद करते हैं। डिस्क अधिभोग, केवल दो विधियाँ हैं, अनुक्रमणिका सूचकांक या संपीडन। नमूनाकरण सूचकांक को कम करना उचित नहीं है, इसलिए विशेषज्ञों ने विभिन्न संपीड़न योजनाएं विकसित की हैं। सबसे मूल डीपीसीएम, एडीपीसीएम हैं, और सबसे प्रसिद्ध एमपी 3 है। इसलिए, डेटा संपीड़न के बाद कोड दर मूल कोड की तुलना में बहुत कम है।

     

    2.9 उदाहरण गणना
    उदाहरण के लिए, "विंडोज एक्सपी स्टार्टअप.वॉ" की फाइल की लंबाई 424,644 बाइट्स है, जो "22050 एचजेड / 16 बिट / स्टीरियो" के प्रारूप में है।

    फिर इसकी संचरण दर प्रति सेकंड (बिट दर, जिसे बिट दर भी कहा जाता है, नमूना दर) 22050162 = 705600 (बीपीएस) है, जो बाइट इकाई में परिवर्तित होती है 705600/8 = 88200 (प्रति सेकंड बाइट्स), प्लेबैक समय: 424644 (कुल बाइट्स) / 88200 (प्रति सेकंड बाइट्स) 4.8145578 XNUMX (सेकंड)।

     

    लेकिन यह पर्याप्त सटीक नहीं है। मानक PCM प्रारूप में WAVE फ़ाइल (* .wav) में हेडर सूचना की कम से कम 42 बाइट्स होती हैं, जिन्हें प्लेबैक समय की गणना करते समय हटा दिया जाना चाहिए, इसलिए है: (424644-42) / (22050162-8-4.8140816) XNUMX XNUMX ( सेकंड)। यह अधिक सटीक है।

     

    3 पीसीएम ऑडियो एन्कोडिंग
    PCM का मतलब पल्स कोड मॉड्यूलेशन है। पीसीएम प्रक्रिया में, इनपुट एनालॉग सिग्नल को नमूना, परिमाणित और कोडित किया जाता है, और बाइनरी कोडित संख्या एनालॉग सिग्नल के आयाम का प्रतिनिधित्व करती है; प्राप्त करने वाला अंत इन कोडों को मूल एनालॉग सिग्नल में पुनर्स्थापित करता है। यही है, डिजिटल ऑडियो के ए / डी रूपांतरण में तीन प्रक्रियाएं शामिल हैं: नमूनाकरण, परिमाणीकरण और एन्कोडिंग।

     

    आवाज PCM की गोद लेने की दर 8kHz है, और नमूना बिट्स की संख्या 8bit है, इसलिए आवाज डिजिटल कोडित सिग्नल की कोड दर 8bit × 8kHz = 64kbps = 8KB / s है।

     

    3.1 ऑडियो कोडिंग के सिद्धांत
    जिस किसी के पास एक निश्चित इलेक्ट्रॉनिक नींव है वह जानता है कि सेंसर द्वारा एकत्र किया गया ऑडियो सिग्नल एक एनालॉग मात्रा है, लेकिन हम वास्तविक ट्रांसमिशन प्रक्रिया में जो उपयोग करते हैं वह एक डिजिटल मात्रा है। और इसमें एनालॉग को डिजिटल में बदलने की प्रक्रिया शामिल है। एनालॉग सिग्नल को वॉयस डिजिटलीकरण की पल्स कोड मॉड्यूलेशन (PCM, पल्स कोडिंग मॉड्यूलेशन) तकनीक का एहसास करने के लिए तीन प्रक्रियाओं, जैसे कि नमूनाकरण, परिमाणीकरण और कोडिंग से गुजरना पड़ता है।

     

    रूपांतरण की प्रक्रिया


    3.1.1 नमूना
    नमूनाकरण एक आवृत्ति पर एक एनालॉग सिग्नल से नमूने (नमूना दर) निकालने की प्रक्रिया है जो सिग्नल बैंडविड्थ (लेक्विस्ट नमूना नमूना प्रमेय) से 2 गुना से अधिक है और इसे समय अक्ष पर असतत नमूना संकेत में बदल दिया जाता है।
    नमूनाकरण दर: हर्ट्ज़ (हर्ट्ज) में व्यक्त असतत संकेत बनाने के लिए प्रति सेकंड एक निरंतर संकेत से निकाले गए नमूनों की संख्या।


    नमूना:
    उदाहरण के लिए, ऑडियो सिग्नल नमूनाकरण दर 8000hz है।
    यह समझा जा सकता है कि उपरोक्त आंकड़े में नमूना 1 सेकंड के लिए समय के साथ वोल्टेज परिवर्तन की वक्र से मेल खाता है, फिर निचला 1 2 3 ... 10, क्योंकि 1-8000 अंक होना चाहिए, अर्थात 1 दूसरे को 8000 भागों में विभाजित किया गया है, और फिर उन्हें उस 8000 मान समय के अनुरूप वोल्टेज मान दिया गया है।

     

    ३.१.२ मात्रा
    यद्यपि नमूना संकेत समय अक्ष पर एक असतत संकेत है, यह अभी भी एक एनालॉग सिग्नल है, और इसके नमूने मूल्य में मूल्यों की एक निश्चित सीमा के भीतर अनंत संख्या में मान हो सकते हैं। "राउंडिंग" विधि को नमूना मानों को "राउंड अप" के लिए अपनाया जाना चाहिए, ताकि एक निश्चित मान सीमा के भीतर नमूना मान को अनंत मानों से मूल्यों की एक सीमित संख्या में बदल दिया जाए। इस प्रक्रिया को कहा जाता है मात्रा का ठहराव।

     

    बिट्स की नमूनाकरण संख्या: डिजिटल सिग्नल का वर्णन करने के लिए उपयोग किए जाने वाले बिट्स की संख्या को संदर्भित करता है।
    8 बिट्स (8 बिट) 2 से 8 वीं शक्ति = 256 का प्रतिनिधित्व करते हैं, 16 बिट्स (16 बिट) 2 से 16 वीं शक्ति का प्रतिनिधित्व करते हैं = 65536;

     

    नमूना:
    उदाहरण के लिए, ऑडियो सेंसर द्वारा एकत्रित वोल्टेज रेंज 0-3.3V है, और नमूना संख्या 8 बिट (बिट) है
    अर्थात्, हम परिमाणीकरण सटीकता के रूप में 3.3V / 2 ^ 8 = 0.0128 मानते हैं।
    हम 3.3 Y को चरण वाई अक्ष के रूप में 0.0128 में विभाजित करते हैं, जैसा कि चित्र 3, 1 2 में दिखाया गया है ... 8 0 0.0128 0.0256 ... 3.3 V हो जाता है
    उदाहरण के लिए, एक नमूना बिंदु का वोल्टेज मान 1.652V (1280.128 और 1290.128 के बीच) है। हम इसे १.६५ वी तक लाते हैं और इसी मात्रा का स्तर १२। है।

     

    3.1.3 एन्कोडिंग
    नमूनाकृत नमूना संकेत दशमलव डिजिटल कोड धाराओं की एक श्रृंखला में तब्दील हो जाता है, जो नमूना अनुक्रम, दशमलव डिजिटल संकेत के अनुसार व्यवस्थित होता है। एक सरल और कुशल डेटा सिस्टम एक बाइनरी कोड सिस्टम है। इसलिए, दशमलव डिजिटल कोड को एक बाइनरी कोड में परिवर्तित किया जाना चाहिए। दशमलव डिजिटल कोड की कुल संख्या के अनुसार, बाइनरी कोडिंग के लिए आवश्यक बिट्स की संख्या निर्धारित की जा सकती है, अर्थात, शब्द की लंबाई (नमूना बिट्स की संख्या)। किसी दिए गए शब्द की लंबाई के साथ परिमाणित नमूना संकेत को बाइनरी कोड स्ट्रीम में बदलने की प्रक्रिया को एन्कोडिंग कहा जाता है।

     

    नमूना:
    इसके बाद के संस्करण 1.65 V 128 के एक परिमाणीकरण स्तर से मेल खाती है। इसी द्विआधारी प्रणाली 10000000 है। यही है, नमूना बिंदु एन्कोडिंग का परिणाम 10000000 है। बेशक, यह एक एन्कोडिंग विधि है जो सकारात्मक और नकारात्मक मानों पर विचार नहीं करती है , और कई प्रकार के एन्कोडिंग तरीके हैं, जिन्हें विशिष्ट मुद्दों के विशिष्ट विश्लेषण की आवश्यकता होती है। (पीसीएम ऑडियो प्रारूप एन्कोडिंग एक कानून 13 पॉलीलाइन एन्कोडिंग है)

     

    3.2 पीसीएम ऑडियो कोडिंग
    पीसीएम सिग्नल किसी भी एन्कोडिंग और संपीड़न (दोषरहित संपीड़न) से नहीं गुजरा है। एनालॉग सिग्नल की तुलना में ट्रांसमिशन सिस्टम के अव्यवस्था और विरूपण से यह आसानी से प्रभावित नहीं होता है। डायनामिक रेंज व्यापक है, और ध्वनि की गुणवत्ता काफी अच्छी है।

     

    3.2.1 PCM एन्कोडिंग
    इस्तेमाल की गई कोडिंग ए-लॉ 13 पॉलीलाइन कोडिंग है।
    विवरण के लिए, कृपया देखें: पीसीएम वॉयस कोडिंग

     

    3.2.2 चैनल
    चैनलों को मोनो और स्टीरियो (दोहरी चैनल) में विभाजित किया जा सकता है।

    PCM का प्रत्येक नमूना मान एक पूर्णांक i में समाहित है, और i की लंबाई निर्दिष्ट नमूना लंबाई को समायोजित करने के लिए आवश्यक बाइट्स की न्यूनतम संख्या है।

     

    नमूना आकार डेटा प्रारूप न्यूनतम मूल्य अधिकतम मूल्य
    8-बिट पीसीएम बिना इंट 0 225 XNUMX
    16-बिट पीसीएम इंट -32767 32767

     

    मोनो ध्वनि फ़ाइलों के लिए, नमूना डेटा एक 8-बिट लघु पूर्णांक (लघु int 00H-FFH) है और नमूना डेटा कालानुक्रमिक क्रम में संग्रहीत है।


    दो-चैनल स्टीरियो साउंड फ़ाइल, प्रत्येक सैंपलिंग डेटा 16-बिट पूर्णांक (int), ऊपरी आठ बिट्स (बाएं चैनल) और निचले आठ बिट्स (दाएं चैनल) क्रमशः दो चैनलों का प्रतिनिधित्व करते हैं, और नमूना डेटा कालानुक्रमिक क्रम में है वैकल्पिक क्रम में जमा करना।
    यही बात तब सच होती है जब सैंपलिंग बिट्स की संख्या 16 बिट्स होती है, और स्टोरेज बाइट ऑर्डर से संबंधित होता है।


    पीसीएम डेटा प्रारूप
    सभी नेटवर्क प्रोटोकॉल डेटा को प्रसारित करने के लिए बड़े एंडियन तरीके का उपयोग करते हैं। इसलिए, बड़ी एंडियन विधि को नेटवर्क बाइट ऑर्डर भी कहा जाता है। जब अलग-अलग बाइट ऑर्डर के साथ दो होस्ट संवाद करते हैं, तो उन्हें ट्रांसमिट करने से पहले डेटा भेजने से पहले नेटवर्क बाइट ऑर्डर में परिवर्तित होना चाहिए।

     

    4 जी.711
    सामान्य पीसीएम में, एनालॉग सिग्नल डिजीटल होने से पहले कुछ प्रसंस्करण (जैसे आयाम संपीड़न) से गुजरता है। एक बार डिजीटल होने के बाद, पीसीएम सिग्नल को आमतौर पर आगे संसाधित किया जाता है (जैसे डिजिटल डेटा संपीड़न)।

     

    G.711 एक मानक मल्टीमीडिया डिजिटल सिग्नल (संपीड़न/विघटन) एल्गोरिथम है जो mआईटीयू-टी से पल्स कोड को नियंत्रित करता है। यह एनालॉग सिग्नल को डिजिटाइज़ करने के लिए एक नमूना तकनीक है, खासकर ऑडियो सिग्नल के लिए। पीसीएम प्रति सेकंड ८००० बार सिग्नल का नमूना लेता है, ८ किलोहर्ट्ज़; प्रत्येक नमूना 8000 बिट है, कुल 8 केबीपीएस (डीएस8)। नमूना स्तरों की कोडिंग के लिए दो मानक हैं। उत्तरी अमेरिका और जापान म्यू-लॉ मानक का उपयोग करते हैं, जबकि अधिकांश अन्य देश ए-लॉ मानक का उपयोग करते हैं।

     

    A- कानून और u- कानून PCM के दो एन्कोडिंग तरीके हैं। यूरोप और मेरे देश में कानून पीसीएम का उपयोग किया जाता है, और उत्तर अमेरिका और जापान में म्यू-कानून का उपयोग किया जाता है। दोनों के बीच का अंतर परिमाणीकरण विधि है। एक कानून 12 बिट्स परिमाणीकरण का उपयोग करता है और यू कानून 13 बिट्स परिमाणीकरण का उपयोग करता है। नमूना आवृत्ति 8KHz है, और दोनों 8bit एन्कोडिंग विधियां हैं।

     

    सरल समझ: पीसीएम ऑडियो उपकरण द्वारा एकत्र किया गया मूल ऑडियो डेटा है। G.711 और AAC दो अलग-अलग एल्गोरिदम हैं, जो एक निश्चित अनुपात में पीसीएम डेटा को संपीड़ित कर सकते हैं, जिससे नेटवर्क ट्रांसमिशन में बैंडविड्थ की बचत होती है।

     

     

     

     

    सभी प्रश्न सूची

    उपनाम

    ईमेल

    प्रशन

    हमारे अन्य उत्पाद:

    व्यावसायिक एफएम रेडियो स्टेशन उपकरण पैकेज

     



     

    होटल आईपीटीवी समाधान

     


      सरप्राइज पाने के लिए ईमेल डालें

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> अफ्रीकी
      sq.fmuser.org -> अल्बानियाई
      ar.fmuser.org -> अरबी
      hy.fmuser.org -> अर्मेनियाई
      az.fmuser.org -> अजरबैजानी
      eu.fmuser.org -> बास्क
      be.fmuser.org -> बेलारूसी
      bg.fmuser.org -> बल्गेरियाई
      ca.fmuser.org -> कातालान
      zh-CN.fmuser.org -> चीनी (सरलीकृत)
      zh-TW.fmuser.org -> चीनी (पारंपरिक)
      hr.fmuser.org -> क्रोएशियाई
      cs.fmuser.org -> चेक
      da.fmuser.org -> डेनिश
      nl.fmuser.org -> डच
      et.fmuser.org -> एस्टोनियाई
      tl.fmuser.org -> फिलिपिनो
      fi.fmuser.org -> फिनिश
      fr.fmuser.org -> फ्रेंच
      gl.fmuser.org -> गैलिशियन्
      ka.fmuser.org -> जॉर्जियाई
      de.fmuser.org -> जर्मन
      el.fmuser.org -> यूनानी
      ht.fmuser.org -> हाईटियन क्रियोल
      iw.fmuser.org -> हिब्रू
      hi.fmuser.org -> हिन्दी
      hu.fmuser.org -> हंगेरी
      is.fmuser.org -> आइसलैंड का
      id.fmuser.org -> इन्डोनेशियाई
      ga.fmuser.org -> आयरिश
      it.fmuser.org -> इतालवी
      ja.fmuser.org -> जापानी
      ko.fmuser.org -> कोरियाई
      lv.fmuser.org -> लातवियाई
      lt.fmuser.org -> लिथुआनियाई
      mk.fmuser.org -> मकदूनियाई
      ms.fmuser.org -> मलय
      mt.fmuser.org -> माल्टीज
      no.fmuser.org -> नार्वेजियन
      fa.fmuser.org -> फारसी
      pl.fmuser.org -> पॉलिश
      pt.fmuser.org -> पुर्तगाली
      ro.fmuser.org -> रोमानियाई
      ru.fmuser.org -> रूसी
      sr.fmuser.org -> सर्बियाई
      sk.fmuser.org -> स्लोवाक
      sl.fmuser.org -> स्लोवेनियाई
      es.fmuser.org -> स्पेनिश
      sw.fmuser.org -> स्वाहिली
      sv.fmuser.org -> स्वीडिश
      th.fmuser.org -> थाई
      tr.fmuser.org -> तुर्की
      uk.fmuser.org -> यूक्रेनी
      ur.fmuser.org -> उर्दू
      vi.fmuser.org -> वियतनामी
      cy.fmuser.org -> वेल्श
      yi.fmuser.org -> येहुदी

       
  •  

    FMUSER वायुहीन प्रसारण वीडियो और ऑडियो अधिक आसान!

  • Contact

    पता:
    No.305 कक्ष हुआलन भवन नं .273 हुआनपु रोड गुआंगझाऊ चीन 510620

    ईमेल:
    [ईमेल संरक्षित]

    टेल / व्हाट्सएप:
    +8618078869184

  • श्रेणियाँ

  • न्यूज़लैटर

    पहला या पूरा नाम

    ईमेल

  • पेपैल समाधान  वेस्टर्न यूनियनचीन का बैंक
    ईमेल:[ईमेल संरक्षित]   WhatsApp: +8618078869184 स्काइपे: Sky198710021 मुझसे बात करो
    कॉपीराइट 2006-2020 द्वारा संचालित www.fmuser.org

    संपर्क करें