CentOS 7 இல் ஹடூப் ஒற்றை முனை கிளஸ்டரை (சூடோனோட்) நிறுவுவது எப்படி


ஹடூப் என்பது திறந்த மூல கட்டமைப்பாகும், இது பிக்டேட்டாவை சமாளிக்க பரவலாக பயன்படுத்தப்படுகிறது. பிக்டேட்டா/டேட்டா அனலிட்டிக்ஸ் திட்டங்கள் பெரும்பாலானவை ஹடூப் சுற்றுச்சூழல் அமைப்பின் மேல் கட்டப்பட்டுள்ளன. இது இரண்டு அடுக்குகளைக் கொண்டுள்ளது, ஒன்று தரவைச் சேமிப்பதற்கும் மற்றொன்று தரவைச் செயலாக்குவதற்கும் ஆகும்.

எச்.டி.எஃப்.எஸ் (ஹடூப் விநியோகிக்கப்பட்ட கோப்பு முறைமை) எனப்படும் அதன் சொந்த கோப்பு முறைமையால் சேமிப்பகம் கவனிக்கப்படும், மேலும் செயலாக்கத்தை YARN (மற்றொரு வள பேச்சுவார்த்தையாளர்) கவனித்துக்கொள்ளும். Mapreduce என்பது ஹடூப் சுற்றுச்சூழல் அமைப்பின் இயல்புநிலை செயலாக்க இயந்திரமாகும்.

இந்த கட்டுரை ஹடூப்பின் சூடோனோட் நிறுவலை நிறுவும் செயல்முறையை விவரிக்கிறது, அங்கு அனைத்து டீமன்களும் (ஜே.வி.எம்) சென்டோஸ் 7 இல் ஒற்றை முனை கிளஸ்டரை இயக்கும்.

இது ஆரம்பத்தில் ஹடூப்பைக் கற்க வேண்டும். நிகழ்நேரத்தில், ஹடூப் ஒரு மல்டினோட் கிளஸ்டராக நிறுவப்படும், அங்கு தரவு சேவையகங்களிடையே தொகுதிகளாக விநியோகிக்கப்படும், மேலும் வேலை இணையாக செயல்படுத்தப்படும்.

  • CentOS 7 சேவையகத்தின் குறைந்தபட்ச நிறுவல்.
  • ஜாவா v1.8 வெளியீடு.
  • ஹடூப் 2.x நிலையான வெளியீடு.

இந்த பக்கத்தில்

  • CentOS 7 இல் ஜாவாவை நிறுவுவது எப்படி
  • CentOS 7 இல் கடவுச்சொல் இல்லாத உள்நுழைவை அமைக்கவும்
  • CentOS 7 இல் ஹடூப் ஒற்றை முனையை எவ்வாறு நிறுவுவது
  • CentOS 7 இல் ஹடூப்பை எவ்வாறு கட்டமைப்பது
  • எச்.டி.எஃப்.எஸ் கோப்பு முறைமையை நேம்நோட் வழியாக வடிவமைத்தல்

1. ஹடூப் என்பது ஜாவாவால் ஆன ஒரு சுற்றுச்சூழல் அமைப்பு. ஹடூப்பை நிறுவ கட்டாயமாக எங்கள் கணினியில் ஜாவா நிறுவப்பட வேண்டும்.

# yum install java-1.8.0-openjdk

2. அடுத்து, கணினியில் நிறுவப்பட்ட ஜாவாவின் பதிப்பைச் சரிபார்க்கவும்.

# java -version

எங்கள் கணினியில் ssh கட்டமைக்கப்பட்டிருக்க வேண்டும், ஹடூப் SSH ஐப் பயன்படுத்தி முனைகளை நிர்வகிக்கும். மாஸ்டர் முனை அதன் அடிமை முனைகளை இணைக்க SSH இணைப்பைப் பயன்படுத்துகிறது மற்றும் தொடக்க மற்றும் நிறுத்த போன்ற செயல்பாட்டைச் செய்கிறது.

கடவுச்சொல் இல்லாத ssh ஐ நாம் அமைக்க வேண்டும், இதன்மூலம் கடவுச்சொல் இல்லாமல் ssh ஐப் பயன்படுத்தி அடிமைகளுடன் மாஸ்டர் தொடர்பு கொள்ள முடியும். இல்லையெனில் ஒவ்வொரு இணைப்பு நிறுவலுக்கும், கடவுச்சொல்லை உள்ளிட வேண்டும்.

இந்த ஒற்றை முனையில், முதன்மை சேவைகள் (நேமனோட், இரண்டாம் நிலை பெயர் மற்றும் வள மேலாளர்) மற்றும் அடிமை சேவைகள் (டேட்டானோட் & நோட்மேனேஜர்) தனி ஜே.வி.எம். இது சிங்கி கணு என்றாலும், அங்கீகாரமின்றி அடிமையைத் தொடர்புகொள்வதற்கு மாஸ்டரை உருவாக்க கடவுச்சொல்-குறைவான ssh வேண்டும்.

3. சேவையகத்தில் பின்வரும் கட்டளைகளைப் பயன்படுத்தி கடவுச்சொல் குறைவான SSH உள்நுழைவை அமைக்கவும்.

# ssh-keygen
# ssh-copy-id -i localhost

4. நீங்கள் கடவுச்சொல் இல்லாத SSH உள்நுழைவை உள்ளமைத்த பிறகு, மீண்டும் உள்நுழைய முயற்சிக்கவும், நீங்கள் கடவுச்சொல் இல்லாமல் இணைக்கப்படுவீர்கள்.

# ssh localhost

5. அப்பாச்சி ஹடூப் வலைத்தளத்திற்குச் சென்று பின்வரும் wget கட்டளையைப் பயன்படுத்தி ஹடூப்பின் நிலையான வெளியீட்டைப் பதிவிறக்கவும்.

# wget https://archive.apache.org/dist/hadoop/core/hadoop-2.10.1/hadoop-2.10.1.tar.gz
# tar xvpzf hadoop-2.10.1.tar.gz

6. அடுத்து, காட்டப்பட்டுள்ளபடி ~/.bashrc கோப்பில் ஹடூப் சூழல் மாறிகள் சேர்க்கவும்.

HADOOP_PREFIX=/root/hadoop-2.10.1
PATH=$PATH:$HADOOP_PREFIX/bin
export PATH JAVA_HOME HADOOP_PREFIX

7. ~/.bashrc கோப்பில் சூழல் மாறிகள் சேர்த்த பிறகு, கோப்பை ஆதாரமாகக் கொண்டு பின்வரும் கட்டளைகளை இயக்குவதன் மூலம் ஹடூப்பை சரிபார்க்கவும்.

# source ~/.bashrc
# cd $HADOOP_PREFIX
# bin/hadoop version

உங்கள் கணினியில் பொருந்துவதற்கு நாங்கள் ஹடூப் உள்ளமைவு கோப்புகளை கீழே கட்டமைக்க வேண்டும். ஹடூப்பில், ஒவ்வொரு சேவைக்கும் அதன் சொந்த போர்ட் எண் மற்றும் தரவைச் சேமிக்க அதன் சொந்த அடைவு உள்ளது.

  • ஹடூப் உள்ளமைவு கோப்புகள் - core-site.xml, hdfs-site.xml, mapred-site.xml & yarn-site.xml

8. முதலில், காட்டப்பட்டுள்ளபடி ஹடூப்- env.sh கோப்பில் JAVA_HOME மற்றும் Hadoop பாதையை புதுப்பிக்க வேண்டும்.

# cd $HADOOP_PREFIX/etc/hadoop
# vi hadoop-env.sh

கோப்பின் தொடக்கத்தில் பின்வரும் வரியை உள்ளிடவும்.

export JAVA_HOME=/usr/lib/jvm/java-1.8.0/jre
export HADOOP_PREFIX=/root/hadoop-2.10.1

9. அடுத்து, core-site.xml கோப்பை மாற்றவும்.

# cd $HADOOP_PREFIX/etc/hadoop
# vi core-site.xml

<configuration> குறிச்சொற்களுக்கு இடையில் காட்டப்பட்டுள்ளபடி ஒட்டவும்.

<configuration>
            <property>
                   <name>fs.defaultFS</name>
                   <value>hdfs://localhost:9000</value>
           </property>
</configuration>

10. tecmint பயனர் வீட்டு அடைவின் கீழ் கீழேயுள்ள கோப்பகங்களை உருவாக்கவும், இது NN மற்றும் DN சேமிப்பகத்திற்கு பயன்படுத்தப்படும்.

# mkdir -p /home/tecmint/hdata/
# mkdir -p /home/tecmint/hdata/data
# mkdir -p /home/tecmint/hdata/name

10. அடுத்து, hdfs-site.xml கோப்பை மாற்றவும்.

# cd $HADOOP_PREFIX/etc/hadoop
# vi hdfs-site.xml

<configuration> குறிச்சொற்களுக்கு இடையில் காட்டப்பட்டுள்ளபடி ஒட்டவும்.

<configuration>
<property>
        <name>dfs.replication</name>
        <value>1</value>
 </property>
  <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/tecmint/hdata/name</value>
  </property>
  <property>
          <name>dfs .datanode.data.dir</name>
          <value>home/tecmint/hdata/data</value>
  </property>
</configuration>

11. மீண்டும், mapred-site.xml கோப்பை மாற்றவும்.

# cd $HADOOP_PREFIX/etc/hadoop
# cp mapred-site.xml.template mapred-site.xml
# vi mapred-site.xml

<configuration> குறிச்சொற்களுக்கு இடையில் காட்டப்பட்டுள்ளபடி ஒட்டவும்.

<configuration>
                <property>
                        <name>mapreduce.framework.name</name>
                        <value>yarn</value>
                </property>
</configuration>

12. கடைசியாக, yarn-site.xml கோப்பை மாற்றவும்.

# cd $HADOOP_PREFIX/etc/hadoop
# vi yarn-site.xml

<configuration> குறிச்சொற்களுக்கு இடையில் காட்டப்பட்டுள்ளபடி ஒட்டவும்.

<configuration>
                <property>
                       <name>yarn.nodemanager.aux-services</name>
                       <value>mapreduce_shuffle</value>
                </property>
</configuration>

13. கிளஸ்டரைத் தொடங்குவதற்கு முன், ஹடூப் என்.என் நிறுவப்பட்டிருக்கும் எங்கள் உள்ளூர் அமைப்பில் அதை வடிவமைக்க வேண்டும். வழக்கமாக, முதல் முறையாக கிளஸ்டரைத் தொடங்குவதற்கு முன் ஆரம்ப கட்டத்தில் இது செய்யப்படும்.

NN ஐ வடிவமைப்பது NN மெட்டாஸ்டோரில் தரவை இழக்கும், எனவே நாம் மிகவும் எச்சரிக்கையாக இருக்க வேண்டும், வேண்டுமென்றே தேவைப்படாவிட்டால் கிளஸ்டர் இயங்கும்போது NN ஐ வடிவமைக்கக்கூடாது.

# cd $HADOOP_PREFIX
# bin/hadoop namenode -format

14. பெயர்நொட் டீமான் மற்றும் டேட்டாநோட் டீமனைத் தொடங்குங்கள்: (போர்ட் 50070).

# cd $HADOOP_PREFIX
# sbin/start-dfs.sh

15. ரிசோர்ஸ் மேனேஜர் டீமான் மற்றும் நோட்மேனேஜர் டீமனைத் தொடங்குங்கள்: (போர்ட் 8088).

# sbin/start-yarn.sh

16. அனைத்து சேவைகளையும் நிறுத்த.

# sbin/stop-dfs.sh
# sbin/stop-dfs.sh

சுருக்கம்
இந்த கட்டுரையில், ஹடூப் சூடோனோட் (ஒற்றை முனை) கிளஸ்டரை அமைப்பதற்கான படிப்படியான செயல்முறையை நாங்கள் சென்றுள்ளோம். உங்களுக்கு லினக்ஸ் பற்றிய அடிப்படை அறிவு இருந்தால், இந்த வழிமுறைகளைப் பின்பற்றினால், கொத்து 40 நிமிடங்களில் யுபி ஆக இருக்கும்.

ஹடூப்பைக் கற்கவும் பயிற்சி செய்யவும் தொடக்கநிலைக்கு இது மிகவும் பயனுள்ளதாக இருக்கும் அல்லது ஹடூப்பின் இந்த வெண்ணிலா பதிப்பை அபிவிருத்தி நோக்கங்களுக்காகப் பயன்படுத்தலாம். நிகழ்நேர கிளஸ்டரை வைத்திருக்க விரும்பினால், குறைந்தபட்சம் 3 இயற்பியல் சேவையகங்கள் கையில் தேவை அல்லது பல சேவையகங்களைக் கொண்டிருப்பதற்கு கிளவுட் வழங்க வேண்டும்.