কোন ফরম্যাটে গান শোনা ভালো। তিনটি তিমি ক্ষতিগ্রস্থ
কোন ফরম্যাটে গান শোনা ভালো। তিনটি তিমি ক্ষতিগ্রস্থ
Anonim

ডিজিটাল অডিও ফরম্যাট বোঝা মোটেও সহজ নয়। কোন ফর্ম্যাটে গান শোনা ভাল তা একটি দ্ব্যর্থহীন উপসংহার করা আরও কঠিন। আপনি যদি উইকিপিডিয়ায় অডিও ফরম্যাটের তুলনামূলক সারণীটি দেখেন, তাহলে আপনার চোখ নীরব সংখ্যার কলাম দিয়ে ঢেউ খেলতে শুরু করবে। এর পিছনে কি আছে তা বের করার চেষ্টা করা যাক।

কোন ফরম্যাটে গান শোনা ভালো। তিনটি তিমি ক্ষতিগ্রস্থ
কোন ফরম্যাটে গান শোনা ভালো। তিনটি তিমি ক্ষতিগ্রস্থ

আসুন এখনই একটি রিজার্ভেশন করি যে নিবন্ধটি শুধুমাত্র সাধারণ বৈশিষ্ট্য সম্পর্কে কথা বলে এবং কিছু বিবরণ অন্তর্ভুক্ত করবে না। ভবিষ্যতে, লাইফহ্যাকার তার নিজস্ব নিরপেক্ষ গবেষণা পরিচালনা করবে। এবং আজ আমরা এক বা অন্য উপায়ে ইতিমধ্যে পরিচিত অভিজ্ঞতা সাধারণীকরণ করার চেষ্টা করব।

একটি এনালগ এবং একটি চিত্র আছে।

এনালগ ভাল, কিন্তু স্বল্পস্থায়ী এবং অসুবিধাজনক। অতএব, অ্যানালগ মিডিয়া, উচ্চ একধরনের প্লাস্টিক বিক্রয় সত্ত্বেও, একটি প্রত্যাবর্তন করবে না।

অডিও ডিজিটাল তিনটি প্রধান ধরনের হতে পারে:

  • কম্প্রেশন ব্যবহার করে না এমন একটি বিন্যাসে;
  • ক্ষতিহীন কম্প্রেশন ব্যবহার করে এমন একটি বিন্যাসে;
  • ক্ষতিকর কম্প্রেশন ব্যবহার করে এমন একটি বিন্যাসে।

প্রথম নজরে, ক্ষতিহীন ফর্ম্যাটগুলি আরও প্রতিশ্রুতিশীল। এটি সর্বদা হয় না, কারণ আমরা নিম্নলিখিত উপকরণগুলির মধ্যে একটিতে আরও বিশদে আলোচনা করব। অসংকুচিত বিন্যাস অডিও বিষয়বস্তু তৈরি করার জন্য প্রয়োজনীয় মাস্টার রেকর্ডিং সঞ্চয় করা ছাড়া অন্য কোন অর্থ তৈরি করে না। এগুলি পুনরুদ্ধার করা সহজ। বাড়িতে রেকর্ডিং সঞ্চয় করা এবং শোনার জন্য অপ্রয়োজনীয়।

ডিজিটাল অডিওর অনেকগুলি পরামিতির মধ্যে, ব্যবহারকারীকে প্রথমে স্যাম্পলিং ফ্রিকোয়েন্সি (সময়ে একটি অ্যানালগ সিগন্যাল ডিজিটাইজ করার নির্ভুলতা), বিট গভীরতা (প্রশস্ততায় ডিজিটাইজ করার যথার্থতা - জোরে), বিট রেট (পরিমাণ) সম্পর্কে যত্ন নেওয়া উচিত। ফাইল প্রতি সেকেন্ডে থাকা তথ্য)।

আজ আমরা ক্ষতির বিষয়ে কথা বলব।

সংকুচিত শব্দের জন্য, সাইকোঅ্যাকোস্টিক মডেলের ধারণাটি অত্যন্ত গুরুত্বপূর্ণ - একজন ব্যক্তি কীভাবে শব্দটি উপলব্ধি করে সে সম্পর্কে বিজ্ঞানী এবং প্রকৌশলীদের ধারণা। কান এটিতে আগত শাব্দ তরঙ্গের সমগ্র বর্ণালী উপলব্ধি করে। যাইহোক, মস্তিষ্ক সংকেত প্রক্রিয়া করে।

মানব-শ্রবণযোগ্য পরিসরের রেফারেন্স মান 16 Hz থেকে 20 kHz পর্যন্ত, কিন্তু সে একই সাথে সমস্ত আগত শব্দ শুনতে এবং সচেতন হতে পারে না।

শ্রবণ বিচ্ছিন্ন এবং এর শ্রবণ সংবেদনশীলতা অ-রৈখিক।

আধুনিক সাইকোঅ্যাকোস্টিক মডেলগুলি মানুষের শ্রবণশক্তিকে সঠিকভাবে মূল্যায়ন করে এবং ক্রমাগত উন্নতি করছে। প্রকৃতপক্ষে, সঙ্গীত প্রেমীদের, সঙ্গীতজ্ঞ এবং অডিওফাইলদের আশ্বাস সত্ত্বেও, গড় অপ্রশিক্ষিত কানের জন্য, সর্বাধিক মানের MP3 এর প্রাথমিক উপস্থিতি অত্যন্ত উপলব্ধিযোগ্য হয়ে উঠেছে। ব্যতিক্রম আছে, তারা থাকতে পারে না। কিন্তু অন্ধ শ্রবণে তারা সবসময় সহজে লক্ষ্য করা যায় না।

সাইকোঅ্যাকোস্টিক কম্প্রেশন মডেল ব্যবহার করে ফরম্যাট

ক্ষতিকারক অডিও কম্প্রেশনের জন্য এই ধরনের অনেক ফরম্যাট আছে। আজ সবচেয়ে সাধারণ নিম্নলিখিত হয়.

OGG (ভরবিস)

সাধারণভাবে, *.ogg এক্সটেনশন সহ একটি ফাইল একটি "ধারক": এটির নিজস্ব ট্যাগ এবং বৈশিষ্ট্য সহ বেশ কয়েকটি সাউন্ড রেকর্ডিং থাকতে পারে। প্রায়শই, এতে সংরক্ষিত ফাইলগুলি Ogg Vorbis কোডেক দিয়ে সংকুচিত হয়, যদিও MP3 বা FLAC সহ অন্যান্যগুলি ব্যবহার করা যেতে পারে।

এর প্রধান সুবিধার মধ্যে রয়েছে এনকোডিংয়ের সময় সম্ভাব্য পরামিতিগুলির বিস্তৃত পরিসর: অডিও স্যাম্পলিং রেট 192 kHz এ পৌঁছাতে পারে, বিট গভীরতা 32 বিট। ডিফল্টরূপে, OGG একটি পরিবর্তনশীল বিট রেট ব্যবহার করে (যদিও এটি বৈশিষ্ট্য প্রদর্শনে দেখানো হয় না), যা 1,000 kbps পর্যন্ত যেতে পারে।

MP3

বিনামূল্যের OGG-এর বিপরীতে, MP3 Fraunhofer Society দ্বারা তৈরি করা হয়েছিল, ফলিত গবেষণার জন্য জার্মান ইনস্টিটিউটগুলির একটি অ্যাসোসিয়েশন, যা আধুনিক ধ্বনিবিদ্যার জন্য অত্যন্ত গুরুত্বপূর্ণ। অডিওফাইলগুলির মধ্যে, যাইহোক, এটি একটি অত্যন্ত সম্মানিত অফিস, তবে, তারা এটি স্বীকার করতে পছন্দ করে না। তবে তাদের উন্নয়ন ঘনিষ্ঠভাবে পর্যবেক্ষণ করা হয়।

OGG এর বিপরীতে, এতে ভেরিয়েবল (VBR) এবং ধ্রুবক বিটরেট (CBR) উভয়ই থাকতে পারে। যাইহোক, এটি MP3 এর জন্য ধন্যবাদ ছিল যে এটি আবিষ্কার করা হয়েছিল যে প্রতিটি রেকর্ডিং একটি পরিবর্তনশীল বিটরেটের সাথে উচ্চ মানের সাথে এনকোড করা যায় না (উপরের কারণগুলি দেখুন, একই উত্স এনকোড করার সময় এনকোডিং অ্যালগরিদম এবং এই ক্ষেত্রে তাদের ফলাফলগুলি ভিন্ন হতে পারে।)

তার উন্নত বয়সের কারণে, MP3 এর উল্লেখযোগ্য সীমাবদ্ধতা রয়েছে: বিট গভীরতা 16-24 বিট হতে পারে, নমুনা ফ্রিকোয়েন্সি শুধুমাত্র বিচ্ছিন্ন মানগুলিতে প্রকাশ করা হয় (8, 11, 025, 12, 16, 22, 05, 24, 32), 44, 1, 48), বিট রেট 320 kbps পর্যন্ত সীমাবদ্ধ। এছাড়াও, MP3 এর নিয়মিত সংস্করণে, চ্যানেলের সংখ্যা দুটিতে সীমাবদ্ধ।

এএসি

একই রেক, শুধুমাত্র প্রোফাইলে। এছাড়াও Fraunhofer সোসাইটি দ্বারা উন্নত. পরে এবং একটি ভিন্ন সাইকোঅ্যাকোস্টিক মডেল ব্যবহার করে, আরও আধুনিক। সর্বজনীনভাবে উপলব্ধ তথ্য আমাদের উপসংহারে পৌঁছাতে দেয়: হ্যাঁ, তারা তাদের নিজস্ব সৃষ্টি উন্নত করতে পরিচালিত করেছে।

এমনকি সবচেয়ে মৌলিক সংখ্যার সাথে, AAC একটি আরও নমনীয় বিন্যাস। এই বিকাশের সাহায্যে প্রাপ্ত ফাইলগুলির বিট গভীরতা 16 থেকে 24 পর্যন্ত, স্যাম্পলিং ফ্রিকোয়েন্সি, যদি ইচ্ছা হয়, শব্দের ছবি হারাতে না দেয় এবং 8-192 kHz এর পরিসরে থাকে। ডেটা স্ট্রিম সাধারণত লসলেস ফরম্যাটের (512 kbps পর্যন্ত) কাছে যায়, যেখানে AAC ফাইল চ্যানেলের সর্বাধিক সংখ্যা 48-এ পৌঁছে।

কোন ফর্ম্যাট অবশ্যই সেরা

বিবেচনা করে যে AAC MP3 এক ডজন বছর পরে পুনর্গঠিত হয়েছে, তারপর পছন্দটি তার পক্ষে। যদি ইচ্ছা হয়, শুধুমাত্র MP3 এবং OGG তুলনা করা বোধগম্য। আসুন ixbt.com থেকে শ্রদ্ধেয় আন্দ্রে অ্যাসপিডভের করা ছবিগুলো দেখে নেওয়া যাক:

1
1

গ্রাফগুলিতে - ভাল অডিওসিডি, ওজিজি পরিবর্তনশীল বিটরেট 350 কেবিপিএস এবং লেম ব্যবহার করে এমপি3 সহ সংকুচিত। গ্রাফটি যত কম হবে, শব্দটি আসলটির কাছাকাছি হবে। এটি একটি খুব আকর্ষণীয় ছবি হতে সক্রিয় আউট. যদিও MP3 স্পষ্টভাবে উচ্চ ফ্রিকোয়েন্সি কেটেছে, OGG এর বিপরীতে, যেখানে আপনি 2 kHz এর নিচে ব্লকেজ দেখতে পারেন।

2
2

শব্দের ফ্রিকোয়েন্সি-টাইম ডিস্ট্রিবিউশন কম আকর্ষণীয় জিনিসের কথা বলে না। 320 kbps এর একটি ধ্রুবক বিটরেটে, MP3 মূল রেকর্ডিংয়ের সাথে প্রায় অভিন্ন। সবকিছু এখন জায়গায় পড়ে যাচ্ছে বলে মনে হচ্ছে। কিন্তু … আসলে, সবকিছু আরও বিভ্রান্তিকর।

লসলেস পাওয়া গেলে কেন লসই ব্যবহার করুন

সাধারণ বোধ.

আসল বিষয়টি হল যে বেশিরভাগ অ্যানালগ রেকর্ডিংগুলিতে উচ্চ মানের বিন্যাসে সংরক্ষণ করা প্রয়োজন এমন তথ্যের পরিমাণ থাকে না। ভুলে যাবেন না যে সিডির জন্য নেটিভ স্যাম্পলিং রেট হল 44.1 kHz, কোয়ান্টাইজেশন মাত্র 16 বিট।

পূর্ববর্তী গ্রাফগুলি MP3 ট্রান্সমিশনের উচ্চ বিশ্বস্ততা ভালভাবে প্রদর্শন করে। কিন্তু একটি অডিও ক্যাসেটের জন্য, চৌম্বক টেপ (যদি না, অবশ্যই, এটি একটি মাস্টার টেপ হয়), একটি AudioCD-এর বৈশিষ্ট্যগুলি অপ্রাপ্য। এবং ভর স্টুডিও সরঞ্জামের জন্য, অডিওসিডির সাথে সম্পর্কিত অ্যানালগ শব্দ রেকর্ড করার ক্ষমতা তুলনামূলকভাবে সম্প্রতি উপস্থিত হয়েছে। FLAC (এবং আরও বেশি WAV-তে) একটি কনসার্ট রেকর্ডিং বা প্রাক-ডিজিটাল যুগের একটি ডিস্ক, বিশেষ করে চৌম্বকীয় মিডিয়া থেকে তৈরি করা ডিজিটাইজ করার কোন মানে নেই। তারা সেই স্পেকট্রা এবং তথ্যের পরিমাণ ধারণ করে না যা কম্প্রেশন ছাড়াই পাত্রে সংরক্ষণ করা যেতে পারে।

আজ কি পরিবর্তন হয়েছে

একজন বিরল সাউন্ড ইঞ্জিনিয়ার সম্পূর্ণ আধুনিক প্রযুক্তি ব্যবহার করে ডিজিটাল মাস্টার রেকর্ডিং (যা পরে ফিজিক্যাল মিডিয়াতে পুনরুত্পাদন করা হয়) করে। অতএব, একটি 24-বিট ট্র্যাক আসলে মাত্র 16-বিট হওয়ার সম্ভাবনা অত্যন্ত বেশি।

উচ্চ-মানের সরঞ্জামগুলিতে অ্যানালগ উচ্চ-মানের রেকর্ডিং আজ খুঁজে পাওয়া আরও কঠিন - যদি শুধুমাত্র এই শব্দের ভক্তদের জন্য। যেমন, উদাহরণস্বরূপ, হোয়াইট স্ট্রাইপসের প্রাক্তন নেতা জ্যাক হোয়াইট। একই সময়ে, তার কিছু রেকর্ডিং লো-ফাই এর বৈচিত্রের উল্লেখ করে এবং সেখানে ট্র্যাকের আপত্তিকর শব্দ বৈশিষ্ট্যগুলি সন্ধান করা গুরমেটদের জন্য এক ধরণের আনন্দ হয়ে ওঠে।

আপনি যদি আদর্শ উত্সটি কল্পনা করেন তবে শুধুমাত্র প্রশিক্ষিত কান বা উচ্চ-মানের অডিও সরঞ্জামে শোনা আপনাকে একটি সংকুচিত ফাইল খুঁজে পেতে অনুমতি দেবে। এবং ইতিমধ্যে এটির উপর ভিত্তি করে (এবং উপলব্ধি সম্পর্কে ভুলে যাওয়া নয়), নিম্নলিখিত উপসংহারটি করা মূল্যবান:

মধ্য-মূল্যের সরঞ্জামগুলির জন্য AAC প্রয়োজনীয় এবং পর্যাপ্ত, যার অনুপস্থিতিতে (এবং AAC-তে এনকোড করা যেতে পারে এমন উত্সের অনুপস্থিতিতে) - লেম 3.93 কোডেক ব্যবহার করে তৈরি 320 kbps এর একটি ধ্রুবক বিটরেট সহ MP3 (এর জন্য প্রস্তাবিত কীগুলি ডিকোডিং: -cbr -b320 -q0 -k -ms)।

ব্যতিক্রমগুলি হল উচ্চ মানের রেকর্ডিং, বলুন, ডিভিডি-অডিও, SACD-তে রেকর্ড করা, অথবা উচ্চ বিট রেট সহ DSD (বা অনুরূপ বিন্যাসে) সংগৃহীত রেকর্ডিং।

যদিও লসলেস এর কিছু বৈশিষ্ট্য রয়েছে। এবং আমরা পরের বার তাদের সম্পর্কে বলব।

প্রস্তাবিত: